美欧飞机补贴案恐再掀巨浪 WTO最早9月30日宣判

记者 郑菁菁 

每年年初,王力行都会对这一年的工作做个预判。在他看来,去年合并同类项的并购已经到达了峰值,2016年的主题之一,肯定是中概股的回归。国足1-2叙利亚

Micromax于2000年由四位合伙人联合创立,但直到2008年才开始出售手机,通过与酷派、金立、Oppo等中国制造商合作快速提供低价手机来积累市场份额。2015年,它推出了超过40款新机型。邓肯布置战术

在解决人的协作、企业的工作协作上,移动办公的需求对服务提供商提出了更高的要求,它要求移动办公应用不仅要具有IM、通话等功能,更要求其能实现基于企业既有信息化设施、符合企业一站式移动工作需求的全方位移动工作解决方案。譬如现在做的最大的云之家,以金蝶多年专业的企业市场为铺垫,构建起了基于企业生态的专业连接能力,其移动轻应用涵盖了金蝶所有的产品体系,甚至包括金蝶竞争对手的产品。以金蝶整个ERP流程审批为例,云之家轻应用已覆盖财务、供应链、制造及CRM 等4个领域的数百种单据,可以快速帮助企业实现业务处理全面移动化。而这些,却是BAT和钉钉等移动工作应用所难以实现的。papi酱怀孕

“在广告服务方面,收入在2010年保持了持续的强劲增长,环比增长44%,同比增长27%,全年增长65%。2010年组织架构改进后,确保了良好的销售执行和客户关系发展。我们对门户中的一些新产品、服务和频道进行了整合,吸引了很大一批新用户,提升了浏览量。在2010年中,我们对中国全国性的活动和赛事的赞助及投入取得了良好的回报,成功提升了公司在门户网站中的地位,给广告商提供了物超所值的广告服务。”王治郅

其中Policy Network用来在Selection和Expansion阶段,衡量为每一个子节点打分,找出最有希望、最最需要预先展开的那个子节点。Policy Network网络的训练,是通过观察其他人类之间对弈的棋局来学习的,主要学习的目标是:“给定一个棋局,我接下来的一步应该怎么走”?(这是一个静态的过程,不用继续深入搜索更深层的子节点)为此,AlphaGo先读取KGS(一个网络围棋对战平台)上面近16万局共3000多万步的人类走法,通过Supervised Learning的方法,学习出来一个简单的SL Policy Network(同时还顺便训练出来Simulation阶段用来一路算到决胜局使用的Rollout Policy)。然后基于这个在人类棋局上学习出来的SL Policy Network, 使用强化学习(Reinforcement Learning)的方法通过自己跟自己对弈,来进一步优化Policy Network。这么做的原因,一个可能的原因是通过人类棋局学出来的SL Policy Network,受到了人类自身能力的局限性的影响(KGS棋局中包含了很多非专业棋手,实力层次不齐),学不出特别好的策略来。那不如在此基础上,自己跟自己打,在此过程中不断学习不断优化自己的策略。这就体现了计算机的优势,只要不断电,计算机可以不分昼夜不断自己跟自己下棋来磨练棋艺。RL Policy Network初始参数就是SL Policy Network的参数,但青出于蓝而胜于蓝,实验指出RL跟SL策略对弈,RL胜率超过80%。RL Policy Network也是最终应用在实际对战过程中MCTS Selection阶段的策略。济南四合院1500万

扫码分享到手机

  • 联通