危欢

危欢

紫荆谷笔记3
基于用户需求的价值解构与重构。 行动中学习:场景导向,快速试错,快速迭代 发散收敛:跨界碰撞,开合有序,把握关键 用户思维:同理观察,用户旅程,痛点搜集探索,定义,设计,呈现。 纳米技术的燕窝:健康爱美,需求的普通用户。对比泰国印尼等,她们浓缩,我们纳米技术,利于吸收,对手效率高:利于吸收做成胶囊和调味包,颗粒状等,随时随地吃。方便携带。价格低廉 ——–广告效应: 燕窝泡面 胶囊用户是对用户有需求,感兴趣的用户。怀孕女性。 用前教育,内地人总认为燕窝是老人吃的,而且比较贵。让他们认识到燕窝并不是天价。并且好处多多。中端和中上端消费群体。纳米技术容易吸收。 >...
紫荆谷笔记2
#2017-12-27音乐教育:教学辅助。。简单直观。我的世界生产:建筑模型。市政规划模型。生物模型。土木,数学模型游戏:移动迷宫,娱乐。房子:收容所。。顾客:人多,密度大,人力成本低,人需求改变,购买力提升。 商业模式创新:特征: 本地环境依赖。 进入壁垒低,容易被模仿。 强调速度 不确定性低 资本助力下周期短 策略: 快 谋求短期垄断 本地渗透,相关多元 技术创新:特征: 国际化依赖 进入壁垒高 强调路径 不确定性高 研发助力下周期长 策略: 准 谋求长期竞争优势 专业化,全球化 找到顾客需求的深层次原因。Timmons 模型 5,4,5,2,6,5,5,6,62...
紫荆谷笔记1
2017-12-26 AM 成本定价,竞争定价,价值定价。 羊毛出在猪身上,360。使用就是价值。 工业时代:市场连续可预测,大众市场,市场有边界约束。商业模式可以平移。单个有效客户的有效成本开销。 信息时代:–用户才构成了微信本身。驾驭不确定性,构成了管理的核心。 谋定而后动,创新驭万变。 创业需要创新。 创业思维,发展创造力与企业创新。 职业经理人: 不需要很完美,做到比别人好,然后快速前行。 放下:放手,让它去成长。创业团队:能力差异,多元互补,共享价值观–发生冲突时,价值利益的选择。创业需要:团队,商机,资源。 吸引顾客手段,博眼球:好玩(什么特别好玩),无聊(看上去很...
Can't serialize variable,RDD嵌套RDD
忘记问题怎么回事了,先标记下吧。一个RDD里面不能使用另外一个RDD。 RDD弹性的分布式数据结构。比如有rdd1和rdd2,你想执行 rdd1.map(lambda x: rdd2.map(lambda y: x+y)), 显然是不行的 你可以想象下,rdd1被分成几块。rdd2也被分成几块了。你要对每条rdd1的数据,都遍历一遍rdd2的数据。这是不可以的。 假设这样可行:就相当于对每一条rdd1的数据,把所有rdd2的块都给它进行计算,其实就是对rdd2做了一次collect。所以原理上就是不对的。
异常点检测Outlier Detection
异常点的检测方法分类 这里说的是检测方法的分类,不是检测方法!! 有监督式,半监督式,和无监督的分类方法。依据是否有人工标注。 聚类算法和统计方法。依据是正常点和异常点的模式不同。有监督的方法 Supervised Methods 需要标注数据。把它看做一个分类问题。 需要分类器。 缺点:大量数据需要认为标注,会产生人为错误。把正常点标注错误False Positive,把异常点标注正常都会发生无监督的方法 用聚类算法,通常异常点距离正常点集合比较远。可以用句类算发找出异常点。 缺点:无法检测出一异常点集合collective outlier 难点:聚类算法无法处理好No...
Can't pickle <type 'function'> attribute lookup __builtin__.function failed;TypeError:can't pickle generator objects
出现这个问题的原因是直接在driver中定义并使用了类,生成对象。spark没用将你的对象拷贝并发送给每一个执行副本 Example123456class A: attr_1 = "abc"Obj = A()def f(x): Obj.attr_1rdd.map(lambda x: f(x)) 以上会产生错误。即使使用broadcast将Obj广播,还是会出错。module not find error,因为spark把Obj广播了,但是没用广播类啊。。。根本不知道你的Obj长啥样,是什么类生成的对象。 Solution 解决方法有 可以尝试把...
Outlier异常点(1)
What is Outlier?很形象的说,就是同一个妈生9个人,8个都是单眼皮,1个是是双眼皮,那一个双眼皮就是异常点,就好像是老王的。 Outlier(异常点/离群点)的种类(3种)1. Global outlier(Point anomaly)全局异常点,显著区别于其他数据。比如{1,2,3,2,1,55}, 这里55就是一个全局异常点。 2. Contenxtual outlier(Conditional outlier)上下文异常或条件异常,在某种条件下是一个异常点。比如:总体数据是北京一年的气温,选出冬天的气温,然而有一天温度是20度,这个20度对于总体数据来说并不是...
KNN的改进方法
主要思想略 取合适的距离函数 欧氏距离对于数字数据,一般都会取欧氏距离,就是我们常说的两点直线距离。 曼哈顿距离我暂时没在KNN里到过。 余弦距离用两个向量的余弦值表示两者之间的距离。 汉明距离两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数。例如字符串“1111”与“1001”之间的汉明距离为2 category距离自己杜撰的,如果一个attribute的任意两个值之间没有关系,都是按照category来计算,比如,course = {algorithm, programming, networking}, 这样在计算两个vector的cou...
Quiet Day
This is my first blog on this site. I hope I can insist on writing blogs.Come on Baby, I am coming. I love my, girlfriend-Zhaoshouting who will be my wife later. I will insist on studying machine learning. I won’t waste a minute. I will be serious on life matters. 穷且益坚,不坠青云之志
危欢
年与时驰,意随日去。
FRIENDS