电炖锅厂家
免费服务热线

Free service

hotline

010-00000000
电炖锅厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

有关大数据你不一定知道的几个冷知识

发布时间:2019-03-13 11:32:27 阅读: 来源:电炖锅厂家

有人说,大数据就像高中生的Sex

每个人都在讨论,

但没人做过。

每个人都以为其他人做过,

由于每个人都宣称自己做过。

这个比喻为尚处在萌芽幼齿阶段的大数据蒙上了一层有趣且暗昧的意味。

在本次SDCC(中国软件开发者大会)上,一些真枪实弹地做过大数据的高中生行业精英,向小火伴们普及了一些有趣的冷知识。

按下按钮,心绪暴露大数据的隐蔽魅力就在于,他比你都了解你。你以为你每次按民警故事下手机按键的动作都是一样的吗?哈哈图样图森破。

来自本日头条的技术副总裁杨震原告知童鞋们,他们正在测试的“黑科技”,恰恰能从你点击按键的时间和手指面积,推测出你当时的情绪。你的漫不经心、愤怒或感动,都能够成为后台为你推送何种消息的根据。未来,以下场景可期:

如果你正处在被女神甩掉的悲伤中,或许客户端会为你推送——弄基的一百种好处。如果你正处在领到本月工资飘飘欲仙的快乐中,或许客户端会为你推送——在北京月两万什么时候能买一个厕所?

那末这类“恰到好处“的情绪拿捏和大数据有甚么关系呢?实际上对你情绪的推测是建立在对你屡次正常点击的记录之上的。这类行动数据乃至在你还未意想到的时候,就“出卖”了你的情绪。

本日头条技术副总裁杨震原在分析一个按钮的平均触摸时间

你的“姿式”,才是真的大数据银行每天的交易账目流水的统计数据,并不是大数据,而每一个用户在拿号以后等待了多久才排到,有多少用户骂娘,有多少用户过于焦急愤而离去,这些真正的行动才是大数据。

杨震原又举了本日头条在运用中的另一个例子。

实际上,你在一篇文章的甚么位置停留多久,然后划动了多远,在新的位置停留了多久,是不是看了评论,看了几条评论,都可以按顺序被记录下来。接下来就是通过算法评估读者的兴趣所在。

CSDN创始人蒋涛也特别提到,美国电商平台Wish正是用大数据的方av女优电影法,根据每个人的数据不同,“看人下菜碟”地推荐你可能喜欢的货品,三年时间已发展成北美最大的电商之一。

所以,一个悲伤的消息是:未来如果你要隐藏自己的身份,不单单要变装易容捏造指纹,乃至连点击手机,查看文章的习惯都要改变了。

大数据就是:一个都不能少如果要想知道有多大比例的人喜欢GV,那末只需要做好抽样调查就可以了,没有必要对所有人进行调查。但是如果你想要推销宅腐的周边智能硬件产品,则需要逐一排查每个人“独特”的兴趣爱好。

所有数据一个都不能少,这就是所谓的“全量加工”,这些数据的制造者正是各大厂商利润的源泉。

360商业产品首席架构师刘鹏是一名网红,他在很多场合都强调:全量加工才是大数据。他说,涉及到个性化推荐、计算广告、个人征信这些场景,大规模的计算就是没法避免的。

从技术角度来讲,之所以大数据可以做到这么精准,也主要得益于技术的进步。感知装备被丰富地用在五花八门的硬件上,使得之前没法记录的数据,现在都可以被记录了。

大数据不应当给人用大数据应当交给机器做决策,而不是交给人做决策。

这类弥漫着对人类深深不信任感的论断一样来自于刘鹏。在他眼中,大数据是为机器提供的粮食。而能够驾驭大数据的人类基本只有两种:数据科学家和统计工作者。

IT企业中养一群科学家的可能性为零。而人类的判断常常基于宏观、战略,不可能有精力做到“因事而异”。相比之下机器的判断比人类更加细致。比如为每一个用户比如画像、贴标签。所以,要想把大数据利用透彻,愚昧的人类还是暂时靠边站吧。

“有点毛病”的大数据更好用“数据”这两个字,天然给人一种完善而且精准的感觉。在这方面,大数据要挑战你的底线。作为数字广告领域的大牛,刘鹏强调,大数据可以存在半一致性这样模棱两可的属性。换句话说,允许数据毛病和丢失。

纳尼?毛病的数据也是好数据吗?没错。由于数据量巨大,而且分析半天常常没什么有用的收获(价值密度低),分析者常常需要选取一些特点数据做加工,而对这些特点数据,或许还要简化以后再加工。所以终究大数据要到达的结果是难得糊涂,却一针见血。

所以,如果有人向爱好人民网的你推荐草榴的时候,先不要发火,你可能只是大数据的一个毛病罢了。

保险公司最喜欢和大数据在一起如果你是一个鲁莽的人,最想知道这个情况的无疑是你的汽车保险公司,想必你的保费会居高不下;如果你是一个谨小慎微的人,最想知道的也是保险公司,由于它可以用打折的保费吸引你投保。

在你身上,乃至存在一个精确的“岀险率”数字。这个听上去很惊悚的数字恰恰是保险公司利润的来源。由于不掌握这样大数据的个人,是没法计算自己的岀险率的。保险公司恰恰利用这类信息不对称,给一个岀险率是万分之一的人开出了千分之一的保价,相当于美国丝袜赚了十倍的利润。

隐私问题要靠技术改进数据比它看上去的模样更险恶,这是大数据业内人士的普遍共鸣。即便隐去了你的姓名电话等等敏感信息,只保存你和其他人联系的记录,熟习你的人完全可以猜到你的身份。目前大数据的安全性,在他人的歹意之下,显得力不从心。

隐私问题,制度只能解决20分,剩下的80分要靠技术进步来解决。

刘鹏如是说。期待市场倒退童年的发现教学设计到前大数据时期,仿佛没有希望了。

如何精确统计出有多少人爱好苍井空,有多少人喜欢武藤兰,但是又不泄漏到底是谁喜欢苍老师,谁喜欢武老师,这是目前大数据的最前沿研究。

有关大数据的政策再严格,没有一套可靠的保密技术,数据的安全都是无从谈起的。隐私算法、数据脱敏、数据隔离。都是研究的方向。在此之前,各位的大数据还都在相对危险的状态。这也是为何目前法律没有制止数据买卖,而各大巨头却不敢将数据出售的缘由。固然,大数据库市场价目前比较低也是一个重要的缘由。

SDCC,中国软件开发者大会。由全球最大中文IT社区CSDN于2007年创办,每一年1届。主题是下一代软件开发技术趋势与对各行业的深入影响,以谈干货实料著称。

相关阅读