大数据早报:用人工智能伪造奥巴马演讲 阿里巴巴市值超过4000亿美元(7.28)

百家 作者:原力AI学院 2017-07-28 05:05:32

来源36大数据,作者:奥兰多

『黑科技』AI能伪造奥巴马演讲视频 还能让你扮演任何人

美国华盛顿大学的一项新研究表明,基于奥巴马公开的音频和视频片段,人工智能软件已经可以生成口型几乎完美匹配、高度逼真的伪造视频,这比普京遭中国大妈围堵更让人吃惊!美国华盛顿大学研究团队用AI“伪造”了奥巴马的演讲视频,通过深度学习该技术能将声音转换为嘴形变化,虽然视频中的音源确实来自奥巴马,但说话场景却完全不同。

制作过程示意图

经过这样一个流程“假视频”就诞生了!研究者表示,之所以选择奥巴马为实验对象,原因在于网络上可轻易取得大量奥巴马公开谈话的高画质影音档,适合用来训练人工智能。和过去研究不同的是,该软件不需要扫描大量的演讲影音资料,也不需要分析不同人说出相同句子的嘴形,才能学会转换声音;其仅需要既有的影音素材即可,所需成本和规模更小。研究者指出,该研究仅分析 17 小时的奥巴马演讲影片就达到此成果,希望未来可以将分析所需影片长度压缩到 1 小时。

『大公司』阿里巴巴股价涨逾1% 市值超过4000亿美元

据CNBC报道,阿里巴巴股价周四涨逾1%,市值超过4000亿美元。阿里巴巴股价现涨1.26%,报157.75美元/股,市值为4040亿美元。在最近公布的2017财年第四财季(2017年第一季度),阿里巴巴集团营收同比增长60%,调整后每股盈利增长83%,自由现金流大增116%。


卡巴斯基免费版上线:无广告 收集数据改善机器学习算法


在部分国家经历了长达一年半的测试之后,卡巴斯基实验室终于面向全球市场推出了免费的防病毒软件。尽管免费软件缺乏卡巴斯基付费产品的诸多功能,但是包含扫描文件、网络流量和邮件、过滤网络活动的防火墙、隔离恶意程序和监控已安装应用活动等功能。

大部分的免费防病毒应用会加入广告或者仅提供 1 个月免费试用期,不过卡巴斯基并不打算这么做。卡巴斯基所提供的免费防病毒应用并没有广告,但是会从免费用户处收集数据来改善机器学习算法,从而更好的打磨所有的产品和平台。

尽管全球开放日期为 7 月 25 日,但是根据地区差异可能需要等待一段时间。公司创始人 Engene Kaspersky 解释道该软件是分区域分阶段发布的,首轮先面向美国和加拿大,在 9 月份面向拉丁美洲、非洲、土耳其和巴西,日本和大部分欧洲国家将会在 10 月份上线,越南和泰国会在 11 月份上线。中国地区已经上线。

Google新成立AI工作室,尤其要解决数据与人才问题


Google 最近在 AI 上的动作有点多。月初时它宣布成立新基金 Gradient Ventures,专门投资 AI 公司。而今天,Google 又宣布成立一个新的工作室 Launchpad Studio,为 AI 公司提供其发展所需的资源。 人人生而平等,但创业公司却生来不平等。AI 创业公司尤其喜欢数据,并想努力获得足够的数据,但这往往是他们所缺乏的。

新的工作室就希望通过专门的数据集,仿真工具和帮助开发原型产品,来满足这些需求。

2017年第二季全球应用下载量达到近250亿次


Appannie公布了今年第二季度全球应用下载数据。这份数据显示,应用程序经济在下载和消费支出上的蓬勃发展。最值得注意的是,Google Play和iOS App Store在应用程序经济中继续展现各自的优势,并共同营造健康的增长市场。

2017年第二季全球应用下载次数在iOS和Google Play上下载量达到近250亿次,同比增长15%,几乎覆盖每个行业,显然移动应用是消费者生活中不可或缺的一部分。

全球下载量增长的最大份额来自Google Play。 Google Play在2017年第二季度同比增长了20%,下载量比iOS高出135%。iOS和Google Play的全球消费者支出在2017年第二季度超过150亿美元,同比增长35%。Appannie这份报告显示,全球iOS和Google Play消费者消费支出在2017年降超过600亿美元。到2021年,预测iOS和Google Play消费者支出将超过1000亿美元。

『应用』大数据:广东移动两年减少八成伪基站活动


据广东移动公布的数据显示,近年来在全社会共同打击之下,伪基站活动频率持续下降,今年上半年同比2015年已下降近8成。

017年上半年累计协助公安机关破获伪基站案件52起、抓捕嫌疑人84人、缴获伪基站设备80套……近日,记者从广东移动获悉,随着近年来广东移动持续完善技术手段,该公司一直配合公安机关严打伪基站,有效遏制了伪基站的活动。

根据广东移动网络异常位置更新数据所反映出来的伪基站活跃程度显示,在2015年伪基站活动最频繁的一年之后,其活跃度持续下降,与2015年同期相比,今年上半年伪基站活动减少了近八成。

 

『国内公司』深耕房地产大数据, TalkingData发布新产品


TalkingData通过在大数据领域多年的深耕细作,总结出了以下四点人口统计新方法:

  • 家庭状态:统计家庭户数的无线网络接入和接入设备数;

  • 通勤出行:路网数据和动线规划,分析通勤,预估出行状态;

  • 空间位置:利用TalkingData积累的数十亿部设备,按板块、网格分析人群;

  • 人口数量:不仅仅面向空间分析,附加时间维度,在时空范围下解释人口流向、趋势。

正是通过上述四点人口统计新方法,TalkingData可以为房地产企业提供人口迁移和经济趋势相关性分析、省内人口吸引力/核状态、区域人口聚集分析、微观流向等数据服务。

禾略创始人兼CEO郑永祥和TalkingData研发副总裁周海鹏共同发布了“时势蓝图”这款重磅数据分析平台产品,该产品包含了以下四大板块:

  • 城市理解:覆盖300多个地级城市数据,帮助房地产企业更好地预测趋势变化;

  • 板块理解:使房地产企业理解土地使用等情况,更有效进行房价预测;

  • 房产理解:对市场情况进行深度剖析;

  • 人群理解:涵盖人口分布分析、人口流动分析、通勤出行情况等人群分析,使得企业对人本数据更加了解,便于决策。

百丽国际7月27日退市 将从电商、大数据方面入手助其转型



7月27日16:00,百丽国际正式撤销在港交所上市地位,“百变美丽”的鞋王谢幕资本市场。

但对于一代“鞋王”来说,百丽国际资产规模、零售网点数量远超同行业其它公司,这使其船大难掉头;之前身为上市公司,其肩负着向股东定期披露经营业绩的压力——转型谈何容易。

根据百丽国际的私有化公告,要约方计划向百丽国际投入财务和运营资源,与公司探索、尝试新的零售模式,并在技术、物流及人才方面投放大量资源。

一位接近此次私有化财团人士表示,财团将会从电商、大数据方面入手,在前端销售和后端供应端发力,帮助百丽更快速地了解市场及消费者需求,使订货、库存等问题变得更加灵活。

清华启迪,基于大数据风控的企业融资服务平台上线


2017年7月24日,启迪之星与启迪金服合作研发的“金服平台”正式上线。据了解,平台启用了自主研发的“大数据风控模型”,联合了多家金融机构,专注用新思路破解科技型中小企业融资难题。

该平台改变了“一看二查三问”的传统尽调方式,利用“大数据+云计算”技术,抓取数百个维度的数据进行计算分析,采样范围覆盖了企业的经营圈、生态圈和朋友圈,摆脱了抵押、担保等传统风控手段,解决了长期以来困扰金融机构的中小企业风险评估问题。

该平台工作人员介绍道,传统的尽调模式已经很难适应今天的需求,而“大数据”技术的引入,带来了巨大变化,一方面金融机构能够更全面地了解企业,另一方面审批效率提升了近10倍。

『新公司』“房88”用大数据和人工智能卖美国房子



今日,一家以人工智能和大数据改造传统房地产业的硅谷科技公司在杭州西湖创意谷正式开业上线。

这家名为“房88”的科技企业创立于2015年的美国硅谷,以web网站(fang88.me)为产品媒介,提供实时更新的美国1200万套房产分析,并利用机器深度学习技术,用大数据解读房产投资。用户登录房88网站,要是看上了哪套美国的房子,还可以通过网站免费下载到该套房源的独家房产报告,以多维度全面了解市场走势、区域详情、产权历史、投资回报率等专业分析。

『新公司』大数据安全公司瀚思科技获1亿人民币B轮融资



7月25日,瀚思科技(简称瀚思)在北京宣布完成B轮融资1亿人民币,这是2017年上半年中国安全领域企业公开披露的最高融资金额。本轮融资由国科嘉和基金和IDG资本领投,南京高科等A轮投资方继续跟投。凡卓资本担任本次融资独家财务顾问。

发布会现场,瀚思发起并联合多家新兴安全公司的“网络安全创新生态联盟”宣告成立。另外,瀚思还宣布推出了升级版企业级安全产品——HanSight Enterprise 3。

帮助政府管理公民数据,LiveStories 获 1000 万美元 A 轮融资



据外媒消息,总部位于美国西雅图的公民数据管理初创公司 Livestories 宣布获得了一笔 1000 万美元的 A 轮融资,领投方为 Ignition Parnters,参投方包括 Founders’ Co-op 和 True Ventures。截至目前,该公司的融资总金额达到了 1400 万美元。

Livestories 研发的软件可以简化公民数据的访问,帮助政府更好地了解公民贫困情况、公民健康情况、经济情况等等。该公司的数据源主要来自于联邦政府、州政府、以及本地政府机构,包括美国劳工统计局和美国疾病预防与控制中心、以及美国人口普查局。

大数据解读票房分布 一图看懂2017上半年中国影市




『每日推书』南京大学教授周志华 所著的《机器学习》



@汪杨: 非常好的书,应该是国内最全面的机器学习理论书籍了

@melete:简明而深刻,厚积薄发的评注非常开拓思维,多是游刃有余之后才可得出的见解,受益匪浅,我觉得给六星也不夸张,论述很系统很全面,对知识领域一览无余、豁然开朗的感觉真好

@飞林沙:作为教材其实需要具备三个条件:印刷排版好,语言表达好,逻辑思路好。从这三点来说,这本书都完胜李航教授的《统计学习方法》,是一本非常值得推荐给机器学习入门者梳理知识以及机器学习从业者温故知新的书。希望周老师的下本书可以增加一些自己对于模型本身的思考和理解,那一定会更受欢迎。

书籍简介:

机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免. 因此, 本书更适合大学三年级以上的理工科本科生和研究生, 以及具有类似背景的对机器学 习感兴趣的人士. 为方便读者, 本书附录给出了一些相关数学基础知识简介.

全书共16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等.前3章之外的后续各章均相对独立, 读者可根据自己的兴趣和时间情况选择使用. 根据课时情况, 一个学期的本科生课程可考虑讲授前9章或前10章; 研究生课程则不妨使用全书.

欢迎小伙伴们推荐更多的好书~

『今日互动』以下是两道大数据工程师的面试题:



1、hdfs中的block默认保存几份?


2、怎样快速的杀死一个job?


欢迎大家一起来解题,你可以把答案通过评论的方式发给我们~~

 End 

阅读排行榜/精华推荐
1
入门学习


如果有人质疑大数据?不妨把这两个视频转给他 

视频:大数据到底是什么 都说干大数据挣钱 1分钟告诉你都在干什么

人人都需要知道 关于大数据最常见的10个问题

2
进阶修炼


从底层到应用,那些数据人的必备技能

如何高效地学好 R?

一个程序员怎样才算精通Python?

3
数据源爬取/收集


排名前50的开源Web爬虫用于数据挖掘

33款可用来抓数据的开源爬虫软件工具

在中国我们如何收集数据?全球数据收集大教程

4
干货教程


PPT:数据可视化,到底该用什么软件来展示数据?

干货|电信运营商数据价值跨行业运营的现状与思考

大数据分析的集中化之路 建设银行大数据应用实践PPT

【实战PPT】看工商银行如何利用大数据洞察客户心声?              

六步,让你用Excel做出强大漂亮的数据地图

 数据商业的崛起 解密中国大数据第一股——国双

双11剁手幕后的阿里“黑科技” OceanBase/金融云架构/ODPS/dataV

金融行业大数据用户画像实践

讲述大数据在金融、电信、工业、商业、电子商务、网络游戏、移动互联网等多个领域的应用,以中立、客观、专业、可信赖的态度,多层次、多维度地影响着最广泛的大数据人群

36大数据

长按识别二维码,关注36大数据

搜索「36大数据」或输入36dsj.com查看更多内容。

投稿/商务/合作:dashuju36@qq.com

点击下方“阅读原文”查看更多

↓↓↓

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接