大数据

  • 大数据时代:生活,工作与思维的大变革
    • 数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。
    • 错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在。
    • 大数据不仅仅让我们不再期待精确性,也让我们无法实现准确性。
    • 大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。
    • 人类学家克利福德·吉尔兹(Clifford Geertz)在其著作《文化的解释》中曾给出了一个朴素而冷静的劝说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”
    • 数据的非理性效果》(The Unreasonable Effectiveness of Data)的文章中写道,“大数据基础上的简单算法比小数据基础上的复杂算法更加有效。”他们就指出,混杂是关键。
    • 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。
    • 系统可以通过一种“反馈学习”的机制,利用自己产生的数据判断自身算法和参数选择的有效性,并实时进行调整,持续改进自身的表现。
    • 大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。
    • (大数据)以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。
  • 智能时代 (吴军)
    • 人类在机器智能领域的成就,其实就是不断地把各种智能 问题转化成消除不确定性的问题,然后再找到能够消除相应不确定性的信息, 如此而已。

机器学习

Linux

GIT

Python

  • 《Python学习手册》

Kotlin

Algorithm

  • 数学之美(吴军)
    • 梁南元——书面汉语自动分词系统
    • 郭 进——统计语言模型和汉语音字转换的一些新结果
    • 郭 进——Critical Tokenization and its Properties
    • 孙茂松——Chinese word segmentation without using lexicon and hand-crafted training data
    • 那么怎么根据接收到的信息来推测说话者想表达的意思呢?我们可以利用叫做"隐含马尔可夫模型"(Hidden Markov Model)来解决这些问题。
    • 语信息熵和语言模型的复杂度
    • 对信息论有兴趣又有一定数学基础的读者,可以阅读斯坦福大学托马斯.科弗 (Thomas Cover) 教授的专著 "信息论基础"(Elements of Information Theory)
    • 信息指纹
    • 在网络搜索的研发中,我们在前面提到的单文本词频/逆文本频率指数(TF/IDF) 和网页排名(page rank)都相当于是网络搜索中的"椭圆模型",它们都很简单易懂。
    • 信息处理的很多数学手段,包括隐含马尔可夫模型子波变换贝叶斯网络等等,在华尔街多有直接的应用。由此可见,数学模型的作用。 自从有了搜索引擎,就有了针对搜索引擎网页排名的作弊(SPAM)。
    • 最大熵模型的计算量仍然是个拦路虎。我在学校时花了很长时间考虑如何简化最大熵模型的计算量。终于有一天,我对我的导师说,我发现一种数学变换,可以将大部分最大熵模型的训练时间在 IIS 的基础上减少两个数量级。我在黑板上推导了一个多小时,他没有找出我的推导中的任何破绽,接着他又回去想了两天,然后告诉我我的算法是对的。从此,我们就建造了一些很大的最大熵模型。这些模型比修修补补的凑合的方法好不少。即使在我找到了快速训练算法以后,为了训练一个包含上下文信息,主题信息和语法信息的文法模型(language model),我并行使用了 20 台当时最快的 SUN 工作站,仍然计算了三个月。由此可见最大熵模型的复杂的一面。**最大熵模型快速算法的实现很复杂,到今天为止,世界上能有效实现这些算法的人也不到一百人。**有兴趣实现一个最大熵模型的读者可以阅读我的论文。
    • LDC 语料库
    • 布隆过滤器
      • 布隆过滤器是由巴顿.布隆于一九七零年提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。我们通过上面的例子来说明起工作原理。
    • 维特比算法
  • 终极算法:机器学习和人工智能如何重塑世界
  • 程序员的数学思维修炼-趣味解读

知乎

心理

  • 天才在左疯子在右
  • 欧洲最受欢迎的思维方法(《赢者思维》精华本)
    • 在五彩缤纷的大千世界中学习如何获得生活经验,在枯燥乏味中学习如何发现生动的生活色彩,是赢者要具备的多维生活。生活不再是平面和二维的了,而是变成三维甚至是四维,变得比现实更现实,这正是我们必须学习的技能。它不是仅靠“智慧箴言”或“保持积极的心态”就能得到的。它是通过智慧和聪明的眼睛,真正看到和认识这个世界而获得的。
    • 真正的赢者应该是多维度的人,他应该在事业和个人生活上都过得丰富多彩。他们不仅能充分享受生活的每一天,而且能感染周围的每一个人。他们那真性的内心充满了平和与满足,比任何奖杯、名誉和金钱,都能提供更多的幸福和快乐。
    • 要想改变自己的生活,就要把知识学透、学全并付诸实践。
    • 追逐一个不可能实现的空想是极为有害的。不如锁定一个切实的目标去做200%的努力,那才是真正的挑战,才会切实获得成功,你才会深感满足。这要比不切实际的空想好得多。
    • 目标提供了改变个人生活的动力去促使你完成任务。如果你的目标是模糊不清的,甚至丧失殆尽,那么你的动力肯定受挫,因为仅仅依靠单一的自律,你是很难长久地坚持下去的,而积极向上的激情将时刻让你充满动力与活力。
    • 要成为赢者,应具有鲜明的目标、积极的态度和坚定的信念,但这只是迈向成功的开始。你还需要变得更有效率、更强大,还需要知道怎样让你的生活改变。
    • 目标的可视化让你的脑力“升级”。
    • 冠军的目标是持久的、有活力的、清晰的、真实的。
    • 形象化集中凝视技术可以影响你一整天。
  • 心理暗示与自我暗示之柯尔效应
    • 你必须明白,我们身上有两层自我:第一层是显意识,我们可以感知并用意志控制的自我;第二层是潜意识,另外一个自我,它与心理暗示直接相通, 发出心理暗示。我们没有注意到自己的潜在自我,就犯了错误, 因为正是第二个自我完全操纵着我们。
    • 心理暗示在与意志力的冲突中总是获胜。所以我说,心理暗示主导人类,而不是他的意志力或意愿。你必须明白,我们身上有两层自我:第一层是显意识,我们可以感知并用意志控制的自我;第二层是潜意识,另外一个自我,它与心理暗示直接相通, 发出心理暗示。我们没有注意到自己的潜在自我,就犯了错误, 因为正是第二个自我完全操纵着我们。
    • 亚里士多德说得更加明确一点儿,他说:“清晰的**使身体服从自己,从而产生行为。**可以激活生命的机能。所以,整个身体可以被改善的**改善。但是,任何**,无论它多么清晰, 也不能改变手、脚或其他器官的形态。”
    • 为了获得整体生活的幸福,每天早晚都重复这个公式:“每一天,我生活的各个方面都变得越来越好”即可,因为生活的各个方面都包括在内了。
    • 作者直白:“我没有磁场力; 我不是神医; 我不是上帝的使者; 我从未治愈任何人; 我能做的你也能做。”
  • 心灵的七种兵器

文学

  • 周国平:我的心灵自传
  • 追风筝的人
  • 爱读书的孩子,不会变坏 (宋怡慧 著)
    • 即使满腹经纶,但没有好的口才来授课,也会让学生听得昏昏欲睡、不知所云呢!即使满腔热血,没有好的口才来凝聚共识,也会让这份理想温暖黯淡无光。但是,好的说话之道,也要有一颗赤诚的心、诚恳的情来润饰,否则,很难做到说好话、做好事、做好人的成果!
    • 如果犯人没有真心忏悔自己的过错,判他死刑,反而让他解脱了。他从头到尾背负的只是一具虚无的十字架,对他没有任何意义;但犯人若真心忏悔自己的罪,为什么不给他一个机会,背负真正沉重的十字架,用赎罪的心活在世上,回馈这个社会?——《虚无的十字架》
    • 现代的文盲,不是看不懂字句,而是不愿意学习,不愿意阅读的人。若你想保持与世界接轨的能力与旺盛的学习动机,阅读是最好的途径。
    • 为你们找到跃过沮丧低潮幽谷的勇气与力量,一如《自由之旅》的文字,即便历经岁月的流转,依然能替我们找到生活中一份朴实无华的智慧与幸福。
    • 当孩子的世界只剩下用学历与薪水来为自己存在的价值背书时,孩子同时也失去许多该重视却漠视的美好事物。
    • 不管未来你要过什么生活,是不是可以用双脚亲近自己的土地,去理解自己成长的地方,找到它的美好,也从中反观自己成长的轨迹? 愿意对身边的人,倾囊相授自己的所学,也有信心可以成为荒漠星空中一颗微亮的星子,指引他人的路。 若有时间,可以读些文学、哲学书,它能培养你拥有深厚的人文气息和敏锐的洞察力,让你在面对生命的疑问时,有更多的思辨知识可作为生命的答案。这样的你,会是一个有**、有温度的年轻人。
    • 从年轻到现在,我一直喜欢泰戈尔《飞鸟集》中的诗句:“生如夏花之灿烂,逝若秋叶之静美”的生活方式。希望此生我能记得善待身边的人,珍惜每个生命的相逢。即使在未来面对死亡时,也能无畏无惧地自然归返,向世界告别。
    • 《荒人手记》曾说:“时间是不可逆的,生命是不可逆的,然则书写的时候,一切不可逆者皆可逆。”书写顶住遗忘;书写铭刻日常,刚开始,面对失败的痛彻心扉,渐渐地也变得云淡风轻起来。尔后的几日,我置身于阅读和书写的岁月,寻回静谧淡然的心境。甚至,也该感谢这次失败的经历,让几个遭遇与我相仿的孩子,在这份同是天涯沦落人的情感基石上,受伤的灵魂被抚慰了,也让我们在未来的路上走得更近了。
    • 在春日热闹的时光,可以读余秋雨的《山居笔记》找一份闲适;在夏日弥漫暑意的岁月,可以读梭罗的《湖滨散记》寻一份沁凉。在秋日苍茫的流光,我特别喜欢钟理和的《原乡人》、钟肇政《鲁冰花》,面对无常逆袭的豁达更显得动人。在冬日静寂的时刻,我特别喜欢阅读《小王子》,让蕴藏心底的真诚与纯真能重现,遇见一个更真实坦率的自己。
    • 每个地方都可以看见魔鬼的影子,只有勇敢面对它,才有可能发现来自后方天堂的微光。 这是一位替代役男到非洲服役写的书,有时间可以推荐给高中生读读。”在医院工作的朋友用手机把《来自天堂的微光》的书讯照片传给我。
    • 月的声音,去撷取小时光中最惬意的那一段。就像吴若权在《每一次出发,都在找回自己》中所说:“每一颗渴望漂泊的心,都有一生期盼靠岸的灵魂。然而,不停地向外出走,只能追求心智的成长;要学着往内在迈进,才会真正获得心灵的成熟。”
    • 几米的绘本让我们用温柔的角度来看世界,甜美缤纷是人生,凄清黑白是人生,世间的每个人都必须和幸福与哀愁同时存在呀! 生命有些缺憾,才有故事可写,有感情可抒发。孤独是创作必要的养分,静谧会让心安定下来,如此的氛围才能产出美好的图像或文字。 因为阅读,许多不曾见面的人,在文字中重逢了;因为阅读,许多不曾细想的回忆,在文字的世界被拥抱了。不复返的青春虽难以唤回,但和孩子在阅读场域的契阔谈燕时,又回来了。 青春扉页启动的小旅行,让遗忘的故事有了重新镌刻铭记的可能。
    • 每个人的心里都住着一个小孩。”受欢迎的成长小说,不仅写出青少年的寂寥,也让长大后的成年人,能透过文字阅读,有一种失落的青春被作家懂得了;年轻生命的茫然无依,被作家明白了;被伤过的心,痛过的情,在作家的文字中被疗愈了。
    • 现在的我可以很轻松地为家长写出许多适合孩子阅读的成长小说,也能很专业地告诉家长:成长小说之所以适合青少年,真正的原因是它疗愈青少年的孤单、创痛、寂寞的情感,在相似的生命困境中,孩子被读懂了,困境被体会了,寂寞的灵魂就能被解救出来了。
    • “难道老师在阅读同一本书时,会因为年纪不同,而有不同的想法吗?”男孩充满疑惑地提问。 “如果要真实呈现重读经典的心情,很像是张潮在《幽梦影》所说:‘少年读书,如隙中窥月;中年读书,如庭中望月;老年读书,如台上玩月。皆以阅历之浅深,为所得之浅深耳。’重读经典对我而言,似乎为生命带来不同的冲击与启发。”
  • 朱自清散文
  • 影响的剖析:文学作为生活方式 (名家文学讲坛)

面试

小说

  • 量子窃贼(The Quantum Thief)
  • 房思琪的初恋乐园
    • 故事中的施暴者有李国华、钱一维。前者贯穿全文,无论是补习班官方、小孩的家长,甚至是班主任还帮他降低女孩的戒心——把女孩载到老师家里——这些能够看见的旁人凿斧的痕迹,其中更重要的是那些无形的“社会”:“他发现社会对性的禁忌感太方便了,强暴一个女生,全世界都觉得是她自己的错,连她都觉得是自己的错。罪恶感又会把她赶回他身边……”
    • 李国华聪明,他十分理解这个社会面对性的暴力时,会站在施暴者的那一方。也因此他可以得到许多的“爱”,无论是房思琪的、郭哓奇的还是那一群在后面排队等待的小女孩的爱。因为这个社会允许。而女孩们必须也必然要面对“被强暴后”的自己,说服自己爱上施暴者——“他硬插进来,而我为此道歉”。若与自己不爱的人做爱是污秽的,而既然老师爱的是自己,如果是真的爱我,就算了。若撕开爱的面纱而奔向丑陋的背后,那就是赤裸裸的“社会性的谋杀”,正如同针对晓奇的那些也不虚构的网络评论一般。
    • 另一个较隐隐然发展在故事之中的暴力是一维对伊纹的暴力,知道钱一维打跑几个女朋友,说穷死也不让女儿嫁过去的张太太,把伊纹介绍给一维。估计整栋大楼的人都知道、老钱奶奶也知道,但面对这样的暴力,大家都安静带过。关于性与性别的暴力从来都不会独立而成,必然由整个社会作为施暴者来确定。特别是性,性的暴力,本质上就是权力的展现。而谁掌握权力,往往就掌握这个社会。李国华、钱一维藉由他们的暴力,宰制了女孩与女人的身体,宰制了她们的自由,从而谋杀了一部分的她们。
    • 伊纹姐姐这角色既是房思琪的对照,也是李国华的对照。作为受暴者,作为美丽的相似的人,她就像是房思琪来不及长大的样子,又像是另一个房思琪。但作为同样是思琪与怡婷的偶像、指导者,同样是讲着那些书的人,她又像是李国华的对照,是另一个**及论述上期待带领思琪与怡婷的人。也因此,某种程度上造成其跟“老师”的竞逐关系。这其实与现实世界多么相符:当女性也开始在知识上逐渐茁壮要成为她人的导师时,那是一种隐含的、私密的,像是“保姆”一样的——同时身兼了引导者却也是受暴者:为了婚姻而中断学业的伊纹,因为婚姻而受到钳制的伊纹。思琪、怡婷与伊纹那珠宝一样的时光,是女性知识的传送,而这些传送,都在努力地与象征正统有着更权威的李国华进行近乎没有的斗争,但也几乎都断送在男性的暴力、社会的暴力之下。
    • 不过,我觉得仍然是带有希望的,即使这个希望很渺茫。我这边的希望指的并非房思琪或任何角色的“希望”,而是女性知识传送的“希望”,就好像是前一代攻克魔王失败的村民还能够留下一点存档给下一代。伊纹得以离开一维与怡婷对思琪的姐妹情谊,甚至包括了伊纹最后能够传达的东西,都还看出在这个暴力当中,渺茫的希望(虽然对我来说,无论伊纹能与不能再爱毛毛,光是毛毛的存在就有点太美好了,好得不像真人一样)。
    • 也因此,才有了最后的那一段话:
    • 怡婷,你才十八岁,你有选择,你可以假装世界上没有人以强暴小女孩为乐,假装从没有小女孩被强暴,假装思琪从不存在,假装你从未跟另一个人共享奶嘴,钢琴,从未有另一个人与你有一模一样的胃口和思绪,你可以过一个资产阶级和平安逸的日子,假装世界上没有精神上的癌,假装世界上没有一个地方有铁栏杆,栏杆背后人人精神癌到了末期,你可以假装世界上只有马卡龙,手冲咖啡和进口文具。但是你也可以选择经历所有思琪曾经感受过的痛楚,学习所有她为了抵御这些痛楚付出的努力,从你们出生相处的时光,到你从日记里读来的时光。你要替思琪上大学,念研究所,谈恋爱,结婚,生小孩,也许会被退学,也许会离婚,也许会死胎,但是,思琪连那种最庸俗、呆钝、刻板的人生都没有办法经历。你懂吗?你要经历并牢牢记住她所有的**,思绪,感情,感觉,记忆与幻想,她的爱,讨厌,恐惧,失重,荒芜,柔情和欲望,你要紧紧拥抱着思琪的痛苦,你可以变成思琪,然后,替她活下去,连思琪的分一起好好地活下去。
    • 我在想这段话,连同后面的那一连串伊纹对于怡婷的教诲,或许是作者奕含书写的动机,来自于真实世界的故事、恶意,而这本书的书写,本身就是一种知识传递的可能。相较于受害者,我曾经很害怕“幸存者”这个词,从刚开始认识强暴,认识一切关于性暴力的理论后,我一度很害怕使用这个词,原因倒是无他,因为我们几乎不会使用这个词去指涉其它种犯罪的受害者,你不会这样说被偷被抢或是被打的人,当用到幸存这个词时,彷彿都是在描述一种屠杀,象是校园枪击、恐怖攻击等。我害怕使用这个词,不是因为它太大而失真,而是从整个社会的谋害中活下来,除了幸存,没有更好的字眼,太确实,让人害怕的确实——身为一个女人,想逃避的确实。
    • 因为,幸存的何止是遭受过性暴力而活过来的人,怡婷,正如同每一个女人活过的轨迹一般,即使不是亲友,即使未曾切身,当我们看着新闻报导,看着批踢踢八卦版,看着奇摩新闻下方的评价,看他们如何继续与施暴者一起施展性暴力时,才突然深吸一口气,啊原来我今天又侥幸地活下来了。
    • 我相信奕含这本书写得极其痛苦,我无法在序中更多提供一些什么,更无法提供怎样的安慰。唯一只能感谢她,在这一刻,让我们一起幸存于这个时空,拥抱那些被社会谋杀了的女人们的思绪与感受,牢记这些感受,然后,好好地活下去。

历史

逻辑