摘要:摘要:本篇前半部分讲了“不作恶”的谷歌。因为倡导和坚持“不作恶”的行为准则,所以谷歌能够长期稳定的发展,也最终成为能改变用户使用互联网习惯的伟大公司。后半部分主要讲IT行业中那些经典的定律,其中包括摩尔定律、安迪比尔定律、反摩尔定律、721定律、诺维格定律以及基因决定定律,这些都是帮助我们理解信息科技浪潮下这些大佬兴衰沉浮的关键。 阅读全文
posted @ 2020-04-07 21:09 数据拾光者 阅读 (10) 评论 (0) 编辑
摘要:本篇主要了解苹果、微软和雅虎三家曾经或者依然雄霸于IT行业中处于浪潮之巅的弄潮儿。乔布斯的他的苹果不仅仅在手机领域,而且在个人电脑、动画电影、音乐等等领域都有颠覆性的成就。微软作为PC的王者,凭借Windows操作系统基本垄断了电脑领域,虽然完美错过移动互联网时代,先后在智能终端、搜索引擎、社交媒体和电子商务等领域完败,但是最终在纳德拉的带领下走向转型之路,将微软从一家软件公司转型成为一家云计算公司。雅虎作为过去世界门户网站之王,虽然已经谢幕,但确是互联网航海时代的海贼王。雅虎的杨致远和费罗制定了整个互联网的游戏规则:开放、免费和盈利,并且沿用至今,所以是当之无愧的对互联网时代贡献最大的人。 阅读全文
posted @ 2020-04-07 21:07 数据拾光者 阅读 (12) 评论 (0) 编辑
摘要:摘要:本篇主要讲解BERT中分类器部分的源码。整体来看主要分成数据处理模块、特征处理模块、模型构建模块和模型运行模块。数据处理模块主要负责数据读入和预处理工作;特征处理模块负责将预处理后的数据转化成特征并持久化到TFRecord格式文件中;模型构建模块主要负责构建BERT模型和模型标准输入数据准备;模型运行模块主要负责模型训练、验证和预测。通过整体到局部的方式我们可以对BERT中的分类器源码有深入的了解。后面可以根据实际的业务需求对分类器进行二次开发。 阅读全文
posted @ 2020-04-07 21:05 数据拾光者 阅读 (95) 评论 (0) 编辑
摘要:父母对于孩子不仅仅要有爱,更要有科学的教育方式,所以持证上岗非常重要。传统的教育方式中放纵的教育方式会让孩子以自我为中心,完全不顾及他人的感受,最严重的是孩子不知道自己行为的边界在哪里。而严格的惩罚式的教育方式虽然效果立竿见影,但是会造成孩子愤怒、报复、反叛和退缩四种长期不良的情绪。前三种负面情绪会在孩子的叛逆期集中爆发,而第四种不良情绪则会让孩子非常自卑。不同于传统的教育方式,正面管教的教育方式核心理念是在互相尊重的基础上,在和善而坚定的氛围中让孩子学会自立。最核心的五个字:和善而坚定。最后使用正面管教,对孩子既不批评,也不表扬。明确父母和孩子的关系应该是横向关系,邀请孩子一起制定规矩。想要孩子尊重父母,我们应该先尊重孩子。教会孩子自尊而不是他尊,明白我们要赢得孩子而不是赢了孩子。上面仅仅是书中很少一部分内容,只有来回细品才能真正学到亲子教育的真谛。有兴趣的小伙伴可以细细品读。 阅读全文
posted @ 2020-03-24 21:47 数据拾光者 阅读 (32) 评论 (0) 编辑
摘要:摘要:本篇主要分享腾讯开源的文本分类项目NeuralClassifier。虽然实际项目中使用BERT进行文本分类,但是在不同的场景下我们可能还需要使用其他的文本分类算法,比如TextCNN、RCNN等等。通过NeuralClassifier开源项目我们可以方便快捷的使用这些模型。本篇并不会重点剖析某个算法,而是从整体的角度使用NeuralClassifier开源工程,更多的是以算法库的方式根据不同的业务场景为我们灵活的提供文本分类算法。 阅读全文
posted @ 2020-03-22 10:56 数据拾光者 阅读 (151) 评论 (0) 编辑
摘要:摘要:如何快速的成长?创建一个微信公众号可能是一个不错的建议。微信公众号可能是一张专属于你的名片,也能帮助我们从一个螺丝钉向中央CPU蜕变,更是我们知识积累沉淀的一个很好的平台。在这里我们还能结交一些志同道合的朋友,充分的利用我们碎片化的时间。终有一天你会发现玩游戏还不如来写一篇文章快乐呢。 阅读全文
posted @ 2020-03-15 21:13 数据拾光者 阅读 (12) 评论 (0) 编辑
摘要:摘要:如果一生中只需要读一本经济学著作,可能就是这本《一课经济学》了。想在复杂的社会中做一个“明白人”,人人可能都需要学点经济学。从破窗谬论到机器是否会导致大规模失业,价格、价值和供求关系三者构成的价值体系,再到政府管制租金对于经济和民生的影响,最低工资法是不是真正的帮助了穷人,再到最后是谁偷走了我的钱包?是通货膨胀。相比于那些复杂难懂的经济学公式,这本书通过一个个生动的例子帮助我们更好的理解这些经济学知识,帮助我们逃离无知而不自知的状态。 阅读全文
posted @ 2020-03-14 16:52 数据拾光者 阅读 (33) 评论 (0) 编辑
摘要:摘要:实际项目中需要将BERT线上化需要使模型又快又好的训练,所以经过调研使用目前BERT最新的派生产品ALBERT。ALBERT通过因式分解和共享层与层之间的参数减少了模型参数量,提升了参数效率;通过SOP替代NOP,增强了网络学习句子的连续性的能力,提升了自监督学习任务的能力;通过去掉dropout可以节省很多临时变量,有效提升模型训练过程中内存的利用率,提升了模型的效率,减少了训练数据的规模。最后将项目中的句子关系判断任务改造成我们实际项目中的文本分类任务用于实际业务需求。可以说是有理论,帮助小伙伴们理解ALBERT为啥训练快了,效果还不错。也有实践,如果需要使用ALBERT做文本分类任务,直接用我改造好的脚本和代码跑起来就行。 阅读全文
posted @ 2020-03-08 18:44 数据拾光者 阅读 (116) 评论 (0) 编辑
摘要:摘要:上一篇读《穷爸爸富爸爸》,我们明白了穷人和富人最本质的区别是富人从不为钱工作,而是让钱为自己工作。越早把自己的每一分钱都投入到资产当中越能早日实现财富自由。本篇读《曾国藩传》,来学习下晚清第一人“立德立功立言三不朽,为师为将为相一完人”的曾国藩为人处世之道,或许我们也能领悟一些人生真谛,帮助我们更好的走漫漫人生路。 阅读全文
posted @ 2020-03-07 17:14 数据拾光者 阅读 (19) 评论 (0) 编辑
摘要:摘要:通常在大厂实际项目中会使用Spark来处理大规模数据下的数据挖掘和分析相关工作。本篇从项目实战中总结常用的Spark特征处理实例,方便小伙伴们更好的使用Spark做数据挖掘相关的工作。 阅读全文
posted @ 2020-03-01 12:19 数据拾光者 阅读 (53) 评论 (0) 编辑
最新chease0ldman老人