Numpy 入门

NumPy 笔记目录

  • [Array Creation](#Array Creation)
  • [Basic Operations](#Basic Operations)
  • [Indexing, Slicing and Iterating](#Indexing, Slicing and Iterating)
  • [Shape Manipulation](#Shape Manipulation)
    • [Changing the shape](#Changing the shape)
    • [Stacking together](#Stacking together)
    • Splitting
    • [Copy and Views](#Copy and Views)

More

Ubuntu16.04 安装 VirtualBox & Vagrant 管理 VirtualBox 各种问题总结

Ubuntu 下安装 VirtualBox

注意:

  • 务必要仔细查看用户手册上对系统和必要环境的依赖。
  • 如果 kernel header 不一致,需要更新 kernel:
    • sudo apt-get install linux-headers-generic 或者
    • sudo apt-get install linux-headers-$(uname -r)
      uname -r 等于你的版本内核,比如我的:4.4.0-21-generic
  • 如果不能重装VBox,需要修改BIOS设置:
    • Security 中的 Secure Boot 设置为“Disabled" (一般设置这个就可以了吧)
    • Startup中的 UEFI/Legacy Boot 选 Both
    • Priority 选 Legacy First,CSM Support 选 Yes
      包括类似 Surface Pro,都可以这样操作。
      另外,由于现在的主板很多都带有 UEFI Secure Boot 功能,可能导致使用USB设备启动不了系统。用此方法也可以搞定。
      参考至: 电脑无法从USB启动可能是 UEFI Secure Boot 在捣鬼!

使用 Vagrant 管理 VirtualBox

注意:

1
2
3
4
5
6
$ vagrant package
No usable default provider could be found for your system.

$ vagrant package --base vagrant-ubuntu64
Vagrant has detected that you have a version of VirtualBox installed that is not supported by this version of Vagrant.
Please install one of the supported versions listed below to use Vagrant: 4.0, 4.1, 4.2, 4.3, 5.0

可参考这两个地方:

辛普森悖论及其哲学思考

什么是辛普森悖论

某个条件下的两组数据,分别讨论时满足某种性质,但合并起来可能导致相反的结论。这就是辛普森悖论。

假设某公司考核员工有个指标叫迟到出错率=(迟到次数+出错次数)/(出勤次数+工作个数),包括出错率和迟到率2个指标。
A员工做了5件重要工作,出错1件;
B员工做了100件很简单的小事情,出错21件。
A员工出勤100次,迟到29次,每次1分钟
B员工出勤10次,迟到9次,每次2小时
则:A员工出错率20%,迟到率29%;B员工出错率21%,迟到率90%,如果分别看出错率和迟到率,A员工明显比B员工优秀。
那么实际情况呢:A员工迟到出错率30/105;B员工迟到出错率30/110,B员工评分高于A员工。
这就是辛普森悖论的典型案例。

为什么会出现辛普森悖论

1、用相对比例(百分比)衡量结果。换句话说,用相对坐标去描述绝对坐标的情况。
常见的例子就是百度Google经常能搜出来的录取比例,女生占比等,比如这篇辛普森悖论:诡异的男女比例以及维基百科的例子。这种例子直接用绝对数值去看就可破解悖论。
2、数据本身是由不同部分构成,而这不同部分的权重可能不同。
第1点说的常见的例子,其实就是将不同结构的权重按 1:1 进行分配的结果(即A学院,B学院)。
我们的案例其实也是这样的,我们做个极端的推理,假设迟到率权重为0,则A员工迟到出错率20%,B员工21%,A员工评分高于B员工。
3、除了构成部分本身权重不同外,不同部分的质量也有区别。
其实,到了这里,我们已经慢慢在接近本质了。那就是:质与量的矛盾。我们身处一个“评价系统”中,自然选择和进化论就是评价的结果。
除了我们熟知的各种数据指标外,还包括我们每一个决策和行为。前者结果非常直观,后者则表现为“命运”。所有的结果都是“物竞天择,适者生存”。这个话题到此为止。

所以,其实这是通过量对质进行评价过程中的三个层次:
第一层:也是最外面的那层,是用相对比例(百分比)表示而造成的结果扭曲;这一层是“显示”出(导致)的错误。
第二层:数据不同构成部分“重要性”(权重)不同而造成的结果扭曲;这一层是未考虑“结构”导致的错误。
第三层:每个构成部分数据本身的“重要性”不同而造成的结果扭曲;这一层是未考虑“内容”导致的错误。

综上,我们可以重新定义一下辛普森悖论:
人们在对事物的评价过程中,未考虑每组数据本身的重要性以及不同部分数据的结构的“权重”,并采用相对指标对结果进行描述而造成的对真实结果的扭曲的一类现象。

再扩展一下,上述定义很重要的两个地方:“人们”和“现象”。
就是说,评价是以人的某种需求为中心的,需求不同,观察到的“现象”亦不同。
这是否让我们想起了薛定谔的那只猫?
另外,是什么让“人”进行“评价”?这个过程究竟是有意识的还是无意识的?

结果应用

简单来说,辛普森悖论告诉我们,任何时候不能简单地根据数据结果而轻易得出一些看似确定的结论。真正的结论需要我们对分析目的进行深入思考,对数据本身进行深入细致地探索研究后才有可能得出。

永远对知识充满敬畏。弱小和无知不是生存的障碍,傲慢才是。

可视化

Simpson’s Paradox

《与机器人共舞》读后感兼谈 AI 与 IA

一位高级科技记者:约翰·马尔科夫的大作,从作者的出身我们就可以猜想这本书的大致风格,绝非理工技术男的思维,写出来的也绝不是纯粹理论或实践方面的干货。看完后,基本正如所料。全书主线非常鲜明,但每一部分内部其实有一点凌乱,一会儿是这个人,一会儿又是另一个人,光是那许多英文名字就已经让人头大了。我给本书打 7 分,还有 0.5 送给亲笔签名。

More

《自私的基因》读书笔记

自私的基因 (豆瓣) 这本书初看可能会颠覆三观,它站在一个更高的视角去看待进化、生命和物种——即一切都是自私的基因操纵的结果。而基因也不是我们通常以为的以 “物种” 为中心,它是在此之上的存在,物种只不过是它们的载体。当然,书中观点并不一定正确,但能为我们提供一种看待问题不同的视角。

More

《海底捞你学不会》读书笔记

一口气看完 海底捞你学不会 (豆瓣),感觉真是一家 “另类” 的公司。

前三章有太多的感动和赞叹,由于我自己也是农村出身,所以对其中很多的观念感同身受,看着他们的成长故事,忍不住呐喊喝彩和流泪。这部分给我的感觉就是:一帮淳朴可爱的人,一家极致有爱的公司。

海底捞的成功可能有以下几个原因:

1、对人性本质的运用。但绝非有意为之,张勇觉得应该将员工当做一家人看,真正尊重他们,他真的一直这么坚持在做,而员工很多都是农村的孩子,生性纯朴,又能吃苦,在得到这么好的工作和有爱的集体后,自然充满感激,以主人翁的心态工作。

2、愿意去服务他人。张勇就是这样的,书中说他的屈辱神经比较麻木,的确如此。他自己的几个事情不谈,后面海底捞开业后发生的一些事情他同样如此,比如欠账的事情。而他带领出来的人也都是如此。再加上很多都是从农村走出来的,本来就不懂,比较自卑,对于那种极致的服务并没有障碍。

3、信任下属,真正放权。无论内部多么重要的岗位还是某个区的开店计划他基本不管,袁华强刚去北京开店亏了300 万,他还是放心让他继续做。

4、勤劳和艰苦奋斗。这个不多说,真的太拼了。12 点下班是常态,能有几人做到。

我们想象一下,一群从农村出来的单纯、勤劳的孩子们,在一个陌生的城市,别人都很看不起你,但却拥有一个真正把你当人小圈子,在这里能感受到爱、能挣到钱,所有人都把你当家人看。他们怎么可能不拼命干活,拼命维护公司的利益?说学不会海底捞的是服务,但有没有想过其实这些人才是你永远弄不到的。他们想法少,单纯勤劳,他们和其他农村孩子一样,优点非常明显。

书的后半部分比较沉重,说到了一系列问题,比如师徒制、流程制度等等。当然最突出的问题就是服务,也主要体现在考核导向上。很多人都发现海底捞好像慢慢开始变味了。

挑战

1、摊子大了,怎么管控才能让海底捞不变味?

2、如何不断地去寻找和培养符合海底捞理念的人?

其实说白了就是人的问题。但仔细想想,人的需求总是自下而上的,底层的满足后自然就会上升到高的一层,还用老的那一套有效吗?时代在变化,还按刚开始创业时的那种要求去要求所有员工,尤其是新加入的高素质员工,能起到作用吗,合适吗?

海底捞这种特殊的文化是和这一帮特殊的人群有关,如何面对新加入的高素质员工和现有员工需求的增加来修正自己的文化到目前依然还是很大的挑战。运用 “真情” 去管理企业固然没问题,但绝不应该忽视 “理性经济人”。

《基业长青》读书笔记

基业长青 (豆瓣) 是一本在企业里很著名的书籍,很多公司高管的书架上都会看到这本书。作者期望通过研究大量成功企业来找出使得这些企业保持长盛不衰的密码,他做到了;但很显然,我们还想放在历史中进一步验证,所以时隔多年再读可能会有更多新的体会。

认识 “你是谁” 比知道 “你要去哪里” 更加重要,因为后者几乎肯定是要改变的。无论是对人还是那些胸怀远大抱负的公司。——再版导言

译者序

一、两位作者的目的:

  1. 找出几位高瞻远瞩公司共同拥有的使他们有别于其他公司的基本特质和动力,并把这些发现化为有用的观念架构。

  2. 有效地把这些发现和观念向大家介绍,以便影响管理方法,造福想创立、构建和维持高瞻远瞩公司的人士。

二、企业为市场所驱动 VS 企业去驱动市场。

三、远见就是见人所未见的艺术。高瞻远瞩公司的驱动力在内部,内心驱动带动,最重要的问题是“我们明天怎样做得比今天更好?”

More