微软亚洲研究院的30项创新技术详解(2)

来源:互联网 发布:淘宝 爱游 怎么样 编辑:程序博客网 时间:2024/04/28 21:53
 ·贴图蒙太奇

纹理贴图能够极大提高3D模型的真实感和丰富它的表面细节,这种技术已经广泛应用于电影和游戏中。但是,将多张来自现实生活的图片贴到一个3D模型上,并且达到低的图像视觉扭曲,一直以来都是一个非常痛苦且耗时的工作,这是因为整个过程完全依赖于数字艺术家的手工操作,生产效率非常低。为此,微软亚洲研究院开发了“贴图蒙太奇”技术,它以几乎全自动的方式工作,能够将多幅图片无缝的贴图在任意复杂的3D模型上,整个过程只需非常少量的人工交互,大大提高了生产效率。

·视觉仿真

做旧技术通过给虚拟场景添加岁月留下的痕迹,比如污渍、锈迹、裂缝、划痕来增强它的真实感。而微软亚洲研究院所开发的是一种能够很好模拟许多变旧现象的虚拟仿真技术,它通过在场景中跟踪大量我们称为γ粒子的特殊粒子来模拟物体变旧过程,这些粒子能够在场景中传播变旧信息。利用这种技术,我们能构造与场景几何相符的变旧效果,设计各种污染源——许多目前技术很难实现的效果都可以通过γ粒子跟踪获得,比如全局污渍渗透、复杂的多重变旧现象等;此外,γ粒子跟踪技术不止能够模拟表面的变旧现象,还能够模拟岁月给物体带来的几何形变。

·新闻搜索

为了更好的展示新闻搜索的结果,微软亚洲研究院设计了一个多媒体的新闻阅读器。在该阅读器中,新闻文字、地图信息、新闻图片以及背景音乐被有机的结合在一起,从而为用户提供一个全新的阅读新闻的体验。

·搜索结果的图片式摘要

传统的网络搜索引擎往往忽略了网页中很多的有用信息,比如图片、Flash动画等等;同样,多媒体搜索引擎则往往忽略了文字信息,使用户很难理解反馈回来的搜索结果。而微软亚洲研究院的Image Snippet技术则彻底改变了这种搜索体验——通过对搜索引擎的访问记录分析,我们发现用户的访问主要集中在网页搜索上,因此我们为网页搜索设计了一个新的界面,用以展示搜索结果。我们从搜索引擎返回的网页中,抽取出一些最有价值的图像插入搜索结果中,这样的界面设计有效地利用了网页中的非文字信息,迄今已经受到测评用户的普遍好评。

·图像搜索结果聚类

该图像搜索结果技术能够实时地将某搜索引擎的结果聚类。它弥补了传统搜索引擎将搜索结果显示成列表方式、从而难以浏览的缺陷。而我们的技术将搜索结果组织成层次的方式,使用户能够迅速确定所需要的结果的位置。

·搜索结果聚类

搜索结果聚类技术由微软亚洲研究院网络搜索与挖掘组开发。它对搜索引擎的查询结果在线进行分组,并为这些分组选取合适的命名。该技术把传统的搜索结果表达方式变得更加易于浏览。常规的聚类算法并不适合这个应用,因为搜索引擎反馈回的摘要比较短小,而且一般的聚类算法运算复杂度较高难以实现实时计算。我们开发的技术从另一方面解决了这个问题。我们的基本做法是首先找到典型的独立主题,然后再把已有的搜索结果按照一定规则分配到这些主题之下,从而实现层次化的浏览界面。

·视频搜索

视频搜索正在成为互联网搜索领域备受关注的焦点之一,然而其局限性也日益突出:首先,目前的视频搜索引擎全部都是基于直接文本(包括相关网页文本,视频脚本,或语音识别等)索引,这些能够直接获取的文本信息常常与真正的视频内容大相径庭;另一方面,由于视频有时间性,简单的视频搜索的结果列表不能有效帮助用户快速了解这些视频的内容,因而难以尽快找到想要的视频;此外,包括视频搜索在内的在线视频服务的商业模式仍不清晰,在线视频广告的相关性远不令人满意。

经过多年的研究,微软亚洲研究院的视频搜索技术能够:

1.更有效地为视频建立索引;

2.更高效地组织和呈现视频搜索结果;

3.提供更智能的视频广告策略,并实现互联网上高效的视频编辑和共享。

·购物搜索

今天,无数有价值的商品信息散布在互联网得各个角落,但用户仍然很难从互联网上有效获得这些产品信息和进行比较购物。通过多年的积累,微软亚洲研究院建立了一个强大的工具集,包括分类、抽取、集成、排列等等,从而有效地从互联网中发掘产品信息,创建全新的商品搜索引擎,使用户通过Shopping Search能够获得轻松、便捷的购物体验。

·伪均匀半透明材质的建模与绘制

在真实世界中,大量的物体是半透明的并具有丰富的表面的细节,象面包,海绵,等等。这些物体在不同的光照条件下,呈现出复杂的光照效果。如何对这类材质建模是计算机图形学里面一个具有挑战性的问题。在这里,我们展示了我们新近开发的一项技术,可以对这类材质进行有效的建模,并从真实的物体样本中获得材质特性。从而使人们第一次可以在计算机上快速生成这类物体的真实图像。

·卡通变形传输

变形技术是计算机动画的关键性技术之一。许多好莱坞电影中的特效都依赖于变形算法实现。其中,把在一个二维或者三维物体上制作好的变形动画应用到另外一个物体上,是计算机动画中的热点研究话题,它在电影工业中有很重要的应用价值。微软亚洲研究院发明了一项微分域三维物体变形技术,能够将卡通中的二维动画重用到三维物体上。仅需简单地在卡通的二维角色和三维物体之间定义几条对应曲线,该项技术就能够自动生成三维物体

·方言语音合成系统

语音合成技术已经在许多领域被广泛的应用,最新的应用扩展到了娱乐领域。在新的应用领域:诸如可以说话的游戏,电子书阅读器,语音存储管理服务或语音多媒体信息业务等领域中,丰富的语音变化的的需要成为了语音合成系统的一个重要特征。绝大多数中文语音合成系统只能说标准的普通话,而我们这里展示的语音合成系统将会说很多北方方言

·个性化的语音合成系统

一般的语音合成系统说话的方式很像播音员在朗读新闻。然而,在某些应用场合,用户并不满足于这样的声音,他们希望计算机可以用声情并茂的声音向他们的孩子说故事,或者希望用他们本人的声音给家人或朋友读电子邮件。这就是个性化语音合成系统。微软亚洲研究院语音组开发的语音合成系统木兰(Mulan)将被预装在下一代的微软操作系统Windows Vista中。

·全分辨率视频稳定

随着数字图像的不断普及,视频信号增强技术变得越来越重要。而视频稳定是最重要的增强技术之一,它消除了图像不必要的抖动,并补偿丢失信息,产生一段新的高质量视频。通常,手持摄像机拍摄的家庭视频,由于不可避免的抖动,会产生不理想的视频图像。为了能够更好的满足家庭用户的需求,微软亚洲研究院开发了一种实用的视频稳定技术,以产生高质量的全分辨率稳定视频。

原创粉丝点击