讲师
金山云
高级总监
武爱敏,金山云高级总监。华北电力大学计算机专业硕士,视频行业资深专家,拥有十多年视频领域研发经验,擅长视频编解码、流媒体传输分发等技术。目前负责视频云产品中心管理工作,历任视频云研发总监、项目管理中心负责人;带领团队保障了“九三”大阅兵、神州第十一次发射,两会直播等多场大型直播活动。在2014年加入金山云之前,先后在蓝汛和博汇科技担任研发技术总监,负责视频技术的研发管理工作。
演讲:智能高清赋能金山视频云
时间
2018-10-20 15:00 - 15:45
地点
主要内容
“枯藤老树昏鸦,空调wifi西瓜。”感谢新媒体时代,让我们在炎炎夏日只要有了空调和wifi就有了全世界。随着高清视频的普及,金山云致力于为视频厂商提供一站式的视频、图像处理服务,通过智能高清技术针对不同场景智能化、定制化的提升用户体验、降低带宽。本次分享主要介绍金山云智能高清这一黑科技到底是什么,以及智能高清引领视频云行业所产生的技术变革。
所属专题
AI与多媒体
就像空气和水一样,AI终将渗透在各个技术领域。本专题将甄选图像理解,NLP,网络发包策略,Codec智能编码等技术与AI技术的结合。
同专题的演讲
沈悦时
作为一个国际性的互动直播平台,Twitch服务的观众分布在世界的很多国家,从而具有千差万别的网络状况。这种差异性给我们试图提高服务质量亦或是发布任何前、后端的新功能都带来巨大的挑战。所以说如能建立起一个用户社区典型网络状况的知识库,那将对我们优化观看体验以及缩短软件部署周期都具有非同一般的意义。 根据平台收集到的海量播放质量指标,我们提出一个无监督学习的方法先对播放行为进行分组,因为每一个细分的播放行为集群都代表一类网络状况。下一步是用仿真和配对的方法来模拟出符合每种播放行为的网络模型。最后我们试图利用仿真出的结果来开发针对移动网络用户的ABR播放算法优化,同时加速它的灰度发布。
刘洛麒
随着全民直播时代的到来,主播对视频质量和创意需求增多,由此产生了视频增强技术的巨大需求。基于360在视频领域的开发经验和技术积累,本次分享为大家介绍人工智能在视频增强中的技术以及相关应用。在算法层面,主要向大家介绍在移动平台中,应用人工智能技术解决人脸,手势,肢体识别等问题,以及相应的技术挑战;其次在应用层面和落地场景中,应用face 贴图,手势特效,人脸美颜,背景抠图等对视频进行渲染和增强,让我们的视频更加生动和有趣。
翟磊
随着实时媒体流分发技术的发展,在医疗,监控,社交和教育等领域,对多媒体数据进行基于深度学习的实时视频流分析的应用场景日益丰富。端到端的实时视频流分析涵盖视频流接入,视频编解码,视频帧前后处理以及深度学习网络推导等一系列流程,流程的复杂性以及深度学习网络调优的需求极大提高了实时视频流分析应用的门槛。为解决这一问题,面向WebRTC的英特尔协同通信开发套件设计了一个端到端的全流程实时视频流分析系统,它具有分布式可扩展的特性,同时实现了基于英特尔平台全加速,并提供了用户对深度学习网络的自由定制,帮助开发者使用极简的代码快速实现符合自身需求的高效实时视频流分析应用。本议题会对该系统的设计原理和优化方法以及所涉及的组件进行详细介绍,同时也会简要介绍其应用开发方法。
Richard Rabbat
We will discuss the move on mobile from long-form video to shorter-content. GIF is a great medium for encoding small animated images, which can be then used in messaging apps such as WeChat and iMessage. It scales poorly when the content is high-resolution and detail-rich. We will discuss how we adopted HTML5 Video (WebP and MP4) to deliver better value to our users, reduce bandwidth needs and increase the use of the platform. We will then discuss the machine learning work we've done to analyze all the content that was being generated by users worldwide. We analyze sports moments, celebrities, read captions from the uploaded video and generally enhance the discoverability of the content. Our work has lead to creators making more than 50 million GIFs, all the way from funny animated stickers to more complex gaming moments to short-form story-telling GIFs and finally 360 content. We'll discuss the issues we faced with off-the-shelf machine learning APIs and how we built and scaled our own machine-learning practice based to deliver solutions unique to our content and our use-case.
邢怀飞
短视频、小视频行业蓬勃发展,各个平台之间的竞争更加激烈,提升视频质量、降低带宽成本,成为每个平台提升竞争力的重要手段。在本次分享中,将对百度云智能编码技术进行深入介绍。结合该技术在百度APP视频FEED、好看视频、全民小视频中的应用实践,进一步介绍AI技术在云转码中的应用探索。
陈震中
In this talk, we will introduce our recent work, from computational visual perception to image coding, processing, and understanding.