微软后院的酷技术

来源 :新电脑 | 被引量 : 0次 | 上传用户:szj188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  Power Map for Excel:
  3D数据可视化工具
  大部分人使用过Excel中的饼图、条形图等图表对数据进行可视化。现在,MSRA协助开发了一款先进的Excel 3D数据可视化工具——Power Map。它允许我们将大量数据以3D可视方式映射到必应地图上,并通过3D柱形图、泡泡图/饼图、热量图和区域图等形式实现数据的可视化,从而让至关重要却容易混淆的数据变得易于理解。
  让手机更加聪明
  手机上的3D发型设计
  真正长出来的头发
  在意自己的发型?或许大家也曾经尝试过用手机App查看自己心仪发型的效果,可无奈“二维”图像总是显得不够真实,并没有什么实际用途。现在,微软亚洲研究院(简称MSRA)开发了一款手机应用程序,仅凭借一张照片便可创建一个非常逼真的3D头发模型。
  学过人物素描的朋友应该知道,头发是最难画的部分。对计算机而言,让上万根发丝看起来自然也是一件难事。在现实世界中,头发的一点点变动都意味着发丝之间遮挡关系的变化:一些原来看不到的发丝暴露出来,另一些原先可见的发丝被遮挡住。而在计算机图像中,这种变化是无法用传统的基于像素操作的图像编辑工具实现的。但是,来自MSRA的新技术模型基于物理真实性(physical plausibility)原则,即模型中头发的根部应总是固定在图中人物的头部,发丝本身应平滑自然,且要尽可能地保持原图中真实头发的长度和连续性。我们可以通过这个App改变头发的颜色、长度等塑造自己的发型。它是逼真的,不仅能用来娱乐,也可以在任何需要头发图像绘制的领域发挥作用。
  基于多传感器融合技术的室内定位
  解决导航的最后100m
  打通移动互联时代位置服务的最后100m,才能触发新的潜力和商机。在智能手机尚未普及的年代,MSRA的技术专家就想到了利用装有加速度计、陀螺仪(即角速度计)和电子指南针的设备来跟踪物体的运动状态,从而实现室内定位。2010年前后,这几个传感器成为智能手机的标准配置,他们的跟踪技术也已经成熟。同时,他们又发现随着Wi-Fi网络的普及,利用手机的Wi-Fi芯片可大大提升定位的准确性和可靠性。与传感器跟踪运动状态相比,Wi-Fi有自身的结构,与建筑物的位置关系是固定的,它的定位误差不会因为用户走的距离变大而增大,所以能实现绝对定位。将Wi-Fi定位与运动状态跟踪技术进行结合,室内定位的精度甚至可能达到惊人的1m~2m。
  相信用不了多久,我们就能通过室内定位技术直达某一楼层的店铺,甚至可以直达某个商品了。
  语飞行云汉语教育互动平台
  手机才是最好的学习机
  真正学好外语,从来就不是一件轻松的事。对于外国小朋友以及小华侨而言,最难的地方是汉字的书写和发音。现在,新加坡华侨小学的学生获得了一个比较轻松的汉语学习秘方——把不认识的东西画在手机或者平板电脑上,通过“语飞行云”互动平台的“认图”功能,词汇和发音就可以显示出来。
  这个“语飞行云”互动平台是MSRA与新加坡华文教研中心等教育机构合作研发的教育互动平台。学生可以把平日的所见所闻拍下来,上载到该平台上和同学分享讨论,让他们觉得汉语和自己的生活息息相关。“语飞行云”平台提供了汉语语音合成器、词汇学习、词语解释、配搭、查询及例句筛选等功能。南侨小学校长陈俊明表示,将电子科技技术有效融入教学并非易事,但他们发现利用该互动平台学习的学生在考试中表现比较优异。
  科技与人文之间
  10亿像素拍摄敦煌石窟佛像
  连阴影都是清晰的
  敦煌莫高窟俗誉为20世纪最有价值的文化发现。然而,人为的破坏和生态的恶化,使敦煌这一历史文化遗产面临着严峻的考验。在更大的游客量需求和为后代保护这份无比宝贵遗产的责任之间寻求平衡,是敦煌莫高窟面临的最大挑战。
  MSRA向敦煌研究院捐赠的专门为莫高窟量身定制的10亿级像素数字相机系统 “飞天号”,大幅度提高了洞窟内壁画拍摄的效率,满足了对佛龛、壁画等文物颜色、几何细节等高精度数字采集的要求。该相机的一大特色是利用焦点合成技术来高精度地捕捉被拍摄物的立体细节,这个功能是其他同类相机无法做到的。当拍摄具有复杂景深变化的斜坡、洞顶和佛龛时,“飞天号”能够自动计算景深,分次拍摄多张同一场景但焦点不同的图像,然后将所有的图像合成,使得同一场景下的每尊塑像、每处壁画都呈现焦点清晰的影像,阴影区域也保留了丰富的细节。这对敦煌莫高窟的数字档案前期拍摄是一个突破,把过去无法高分辨率拍摄的佛龛变成了可能,使得洞窟的数字档案实现了绘塑完整的统一空间。
  不是每个人都有机会到莫高窟,但每个感兴趣的人都可以在网上一睹敦煌壁画的艺术风采,甚至比在现场观看更加栩栩如生。
  基于Kinect的手语翻译系统
  人人都能“听”懂手语
  世界各地有3.6亿的听力障碍人士,每一天,他们都面临着大多数人从来无需考虑也难以想象的沟通挑战。如何开发一种工具,让人“听”得懂手语,帮助听障人士改善生活质量?MSRA与中国科学院计算技术研究所和北京联合大学合作,希望借助Kinect设备打破沟通障碍。
  首先,他们利用能同时捕捉色彩和深度图像信息的Kinect,准确捕捉到听障人士的手势,然后结合自然语言处理技术在屏幕上显示手语的含义。这项成果以MSRA在翻译和自然语言处理、语音和手势识别等自然用户界面领域的广泛研究成果为基础。设想一下,听障人士在健听的观众面前用手语发表演说,每位观众都能不费吹灰之力听懂他的演说,这让我们看到了让聋哑患者“发声”的新希望。
  用于触摸屏与指尖互动的触觉反馈
  触摸屏有反应了
  现在,触摸屏移动设备已经非常普及。当我们点按屏幕上的图标时,通常会获得视觉上的反馈——软件会响应我们的操作,屏幕显示的内容会有变化。有时候,我们还可以开启“触摸时震动”的功能,获得更明确的触觉反馈。但震动的是整个手机,我们没办法只让屏幕的某个区域震动,所以无法给视觉障碍人士带来真正的帮助。   终于,MSRA的研发人员已经能够在触摸屏上实现“触觉反馈”——沿着手机触摸屏滑动手指,就可以借助贴在屏幕边缘的压电致动器营造表面摩擦效果。看似很简单,却意义重大,它将转变和提升基于触摸的交互技术。除了帮助视觉障碍人士之外,普通人在玩带有虚拟手柄的触屏游戏时,也能体验到更真实的手感了。
  从这里看到未来
  实时语音翻译
  抢同声传译员的饭碗
  想象一下这样的场景:我们只身一人在国外需要订餐,如果我们所说的中文能够立即被翻译成当地语言,并用自己的声音念出来,而发音、声调和语调与当地人别无二致。是不是很神奇?微软的实时语音翻译系统正以此作为目标,它集合了多项突破性研究成果,包括语音识别、文本翻译、个性化语音合成等,将人们的交谈内容从一种语言同步地转换成另一种语言,并尝试保留使用者本人的语音特征。
  该系统突破性地利用了深层神经网络(DNN)技术,相较传统技术大幅提升了口语对话识别成文本的准确度。借助这项技术并通过模拟人脑行为,微软的研究人员开发出了具有更高辨别能力的语音识别器,可以说这是几十年来通过单一技术提高语音识别准确率的最大突破。另一项重要突破是个性化语音合成,它能够保留使用者的个性化语音特征。此外,MSRA经过不懈努力,在机器翻译领域也取得了进展,尤其是在英语和汉语间的互译上,将单纯的文本翻译延展到了对语音的翻译。当前,微软的实时语音翻译还有很多约束条件,比如语速不能快,发音要足够标准,但它依然让我们看到了一个可以打破语言障碍的未来。
  基于视网膜中央凹视觉的3D图像
  只有自己最清楚
  高品质3D图像吸引着人们的眼球,并开创了各种视觉化的可能。然而遗憾的是,目前的硬件设备在实时处理超高分辨率的图像时存在很大局限。人们往往面临两种选择:为获得极致的3D体验购买庞大且昂贵的设备;或是接受真实感略为逊色的效果而使用轻便的移动设备。
  如今,这种两难的境况将有所改变。MSRA的研究人员正在开发一项技术,根据人类视觉形成的特点,对3D画面进行绘制——通过专门的设备跟踪视觉焦点,然后仅在视觉焦点处绘制高分辨率和高精度的图像;而在其他区域,由于人类视觉无法清楚感知,所以可采用相对较低的分辨率。这项名为“基于视网膜中央凹视觉的3D图像”技术,正是在人眼观察方向的度量范围内放置高层次细节,并以同心圆方式向外逐级减少细节。为了在现实世界的物理局限下实现我们所期望的视觉体验,就必须充分利用有关人类视觉的全部知识,超越对像素渲染的单纯追求,展现人类的智慧而非显示器本身。这种体验更贴合人类视觉的原理,在实现惊人的清晰度和逼真度的同时,却更加节能。当我们用更少的资源享受更好的3D图像时,旁人只能盯着模糊的屏幕纳闷了。
  英库问答
  真正理解搜索意图
  英库问答是一个通用问答引擎。对于用户给出的问题,英库问答通过对自然语言问题的深度理解,从知识库、互联网以及问答社区获取候选答案和证据,并通过自动推理、答案排序、可信度估计等步骤,最终提供精确的答案。英库问答可以广泛用于自然语言搜索、商业智能、语音助手等应用场景中。与传统的搜索引擎相比,它真正去分析和理解用户的搜索意图,而不是根据关键词进行网页排序。苹果的Siri和Google的Google Now已经在尝试让用户直接向手机提问,手机直接给出答案,但它们目前真正能做好的事情还非常有限,大部分时候仍要求助传统搜索引擎。英库问答虽然目前没提供语音服务,但它是通用的问答引擎,对于事实性的问题都可以直接提供答案,适用范围远比前两者更广。
其他文献
笔记本电脑综合成绩新纪录  我们选择的产品,均为2012年和2013年综合测试成绩的第一名。随着Haswell处理器的逐渐普及,今年产品在获得更高性能的同时,便携性也得到了提升。  笔记本电脑综合成绩新纪录  从图表中我们不难看出,得益于更低功耗的Haswell处理器,2013年下半年的产品在电池续航时间上得到了明显提升。  相机分辨率测试成绩  在数码相机领域,每年都有成像质量更优秀的镜头随同新
期刊
搜索引擎:搜狗  2013年9月,腾讯注资4.5亿美元给搜狗公司,同时将搜搜业务并入搜狗。腾讯拿下新搜狗公司40%左右的股份,但该公司控股方仍为搜狐,新搜狗继续作为搜狐子公司独立运营。腾讯此举让一直觊觎搜狗的奇虎360希望落空。  游戏开发商:动视暴雪  2013年7月,腾讯借动视暴雪从母公司回购股份的机会,战略入股这家知名游戏《魔兽世界》和《使命召唤》的开发商,拿下6%的股份。早在1年之前,腾讯
期刊
特斯拉:创新赢得未来  虽然没有在传统媒体上投放任何广告,但是充满魅力的创新产品、追求极致的用户体验、颠覆传统的商业模式,让特斯拉的股价在过去一年中上涨了超过400%。虽然有人认为特斯拉股价被高估,但是许多股民确信自己买到的是未来。  点评:在产品思维、用户体验、商业模式上,特斯拉都带来了颠覆式创新。  Google:再创历史新高  除了Android在智能手机市场份额创下81%的新纪录,Goog
期刊
PC:最糟糕的一年  根据近期Gartner发布的报告,在经历了连续六个季度的下滑之后,第三季度全球PC销量比去年同期下滑8.6%,降至自2008年以来的最低水平。曾经有PC厂商寄望于Windows 8能够拉动市场,但如今看来这只是个美好的愿望而已。  点评:一切正如Gartner所描述的那样:“今年是PC市场最糟糕的一年。”  传统卖场:人气日渐惨淡  大批的闲置柜台和惨淡的人气,让许多商家感受
期刊
为解决这一问题,索尼推出了以VAIO Tap 11和VAIO Fit-14N19SC变形本为代表的全新VAIO产品,在增强了PC产品的移动性能体验的同时,使其可以像手机和平板电脑一样便携,从而进一步提升用户的工作效率与创造力。自此,索尼VAIO系列分为了主打高端移动的VAIO Duo、主打专业轻薄的VAIO Pro、主打移动便携的VAIO Tap和主打主流市场的VAIO Fit4等条产品线,在明确
期刊
历数富士胶片X-Trans CMOS和EXR处理器的发展历程,X-Pro 1采用了第一代APS-C画幅的X-Trans CMOS和EXR影像处理器,其所拥有的高分辨率、高感低噪和混合式取景器等优势已人尽皆知。之后的X-E1和X-A1影像传感器虽然依旧是第一代,但是通过对EXR影像处理器进行更新换代,仍然在分辨率和影像噪点两方面的实测成绩上有所提升。而第二代的X-Trans CMOS和EXR影像处理
期刊
提到多功能一体机产品,许多人的印象也许还停留在高速的商用激光打印产品上,不过较高的购置成本和打印成本,也让许多用户退而却步。然而随着技术的进步,喷墨打印机无论在质量、性能还是打印成本方面都有了长足的进步,这也让许多中小企业开始转投喷墨打印机的怀抱。除了商用领域外,个人和家用领域增长的拉动力也不容小觑,随着技术的进步和成本的降低,加上许多家庭用户对打印机的需求越来越高,打印机也逐渐进入寻常百姓家。无
期刊
终于,首台采用全画幅影像传感器的微单数码相机还是由索尼率先推出了,并且还是两台。索尼的这一手如同当年凭借APS-C画幅的NEX-5C领先于众多M4/3阵营那般,如今的A7R和A7则依仗着全画幅的优势与很多APS-C画幅机型拉开了距离,甚至对低价全画幅单反相机也形成了一定的威胁。而A7R不仅在画幅尺寸上树立了一个里程碑,而且在传感器像素数方面也树立了新标杆。其中,A7和A7R的像素数分别为2 400
期刊
智能手机在日常使用中屏幕最容易出现问题,虽然目前新一代的智能手机屏幕外层大多采用坚固耐用的钢化玻璃,但是屏幕破碎之类的情况仍是很常见的。不过,通常屏幕破碎的智能手机仍然可以正常使用,因为大多都仅仅是外层玻璃破裂。对于这样的手机,我们可以考虑自己动手进行维修,只要准备好适当的工具,掌握正确的方法,这并不是一件困难的事情。下面,我们将以三星GALAXY S3 mini为例,向大家具体地介绍为智能手机更
期刊
在为Gmail增加新功能的同时,Google也更新了Gmail的Web客户端以及Android等移动系统的Gmail应用程序。然而,运行最新版本的Gmail应用程序,Android设备最低要求是4.0版本,这意味着许多无法更新到Android 4.0的旧设备将无法使用新版本的Gmail。  新的Gmail客户端最大的改变是为收件箱添加了自动分类的标签页,默认设置的标签包括“主要”、“社交”、“推广
期刊