演讲回顾
王亚楠:基于强化学习的自动码率调节
本文来自 爱奇艺 技术产品中心 资深工程师 王亚楠在LiveVideoStackCon 2018热身分享,并由LiveVideoStack整理而成。在分享中,王亚楠分别介绍了自动码率调节的实现过程、现行算法与评价标准,并重点介绍了基于强化学习的自动码率调节算法的技术架构与实现要点。
百家云直播系统技术演进历程
本文来自百家云技术总监张弩在LiveVideoStackCon 2017大会上的分享,并由LiveVideoStack整理而成。张弩分别从服务器端与架构端介绍了百家云的整体结构演进,并对未来行业的发展方向进行了分析、展望。
何亚明:Facebook的工具文化和多媒体QoE
本文来自 阿里巴巴 信息平台资深技术专家 何亚明在LiveVideoStackCon 2018热身分享,并由LiveVideoStack整理而成。在分享中,何亚明介绍了Facebook工程师团队的特点与其常用的几种开发工具,并对其开发流程与实际测试方法进行了总结。
Twitch 沈悦时:国内外互联网直播生态差异
本文来自Twitch Principal Research Engineer 沈悦时在LiveVideoStackCon 2018热身分享,并由LiveVideoStack整理而成。在分享中,沈悦时介绍了Twitch的运营内容与产业规模,并从成本与架构方面介绍了国内外直播生态的差异。
隐藏在摄像头里的AI
本文来自驭势科技人工智能组组长潘争在LiveVideoStackCon 2017大会上的分享,并由LiveVideoStack整理而成。潘争回顾了AI在图像识别领域的历史与难点,以及在安防和自动驾驶方面的实现思路。
CCtalk高可用多媒体服务技术选型与实现
本文来自沪江技术中心开发经理杨福强在LiveVideoStackCon 2017上的分享,并由LiveVideoStack整理而成。杨福强于2012年加入沪江,主要从事教学互动平台CCtalk的开发,今天他将为我们分享高品质教学平台的一些技术难点和解决方案。
FFmpeg Maintainer赵军:FFmpeg关键组件与硬件加速
本文来自FFmpeg Maintainer赵军在LiveVideoStackCon 2018热身分享,并由LiveVideoStack整理而成。在分享中,赵军介绍了FFmpeg的历史、关键组件,并介绍了英特尔平台上的多种FFmpeg硬件加速方式。
沉浸式媒体
本文来自华为多媒体实验室首席科学家、实验室副主任王田在LiveVideoStackCon 2017上的分享。他分享了沉浸式媒体的进展与演进路线,展现了可期的多媒体新体验。
网易工业级WebRTC应用实践深度解析
本文来自网易云信CTO赵加雨在LiveVideoStackCon2017上的分享,并由 LiveVideoStack整理而成。赵加雨阐述了网易在WebRTC上的探索和改进,以及如何与WebRTC进行互通。
时永方:做到这三点,你就是多媒体内行了
腾讯多媒体内核中心高级研究员时永方接受了LiveVideoStack的邮件采访,谈及了个人成长中的关键时刻,学习多媒体开发的三点核心,以及在5G和高清时代下,微信多媒体团队面临的挑战。
熊猫TV直播H5播放器架构探索
本文来自熊猫TV音视频技术专家姜雨晴在LiveVideoStackCon 2017上的分享,并有LiveVideoStack整理成文。当下,打造一款播放器已经有比较好的开源实现,但熊猫TV为什么还要自研一款H5播放器呢?为了保证业务持续扩展能力,需要对播放器做解耦。同时,在播放器上线初期还遇到了音画不同步、故障定位、客户端性能不足等问题。
微博短视频服务优化实践
本文来自新浪微博视频转码平台技术负责人李成亚在LiveVideoStackCon 2017上的分享,由LiveVideoStack整理成文。李成亚分享了微博短视频如何提升用户体验、降低成本的思路与实践,包括提升短视频发布速度,降低长视频转码时间,通过新的Codec减少带宽成本等。
Hulu 视频QoS优化策略
QoS直接关系到用户体验,如何提升QoS就成为视频平台技术实力的体现。本文来自Hulu全球高级研发经理、视频编解码与传输领域资深专家傅徳良在LiveVideoStackCon 2017上的分享。尽管Hulu提供服务的网络环境与国内大相径庭,但其相关QoS保障策略依然值得借鉴。
李浩:无限节点的CDN架构演进
本文来自网心科技首席架构师李浩在LiveVideoStackCon 2017大会上的分享,李浩回顾了从迅雷时代到网心科技,P2P CDN的演进,以及挑战和应对方案。
展晓凯:“零经验”的我与唱吧从零到四亿
正如展晓凯总结的那样,一个技术人或团队的成功离不开业务打下的基础,业务高层的高瞻远瞩以及对技术的敬畏,以及技术人的学习与探索精神。LiveVideoStack对全民快乐研发高级总监展晓凯进行了邮件采访,他总结了在与唱吧从零成长的历程。作为一个“零”多媒体基础的技术人,展晓凯的经验也许是你成长路上的参考。
低延迟音视频传输技术在直播领域的应用
本文来自陌陌视频流媒体技术负责人吴涛在WebRTCon 2018上的分享,他详解了陌陌从传统直播过渡到1对1到多人互动模式的演进,架构的优化保证了用户体验与业务需求。另外,文末为WebRTCon 2018最后一波PPT分享,点击阅读原文下载。
李大龙:音视频技术是互联网品质生活的连接器
结识李大龙源于LiveVideoStackCon 2017,忙碌的工作让我们在会场擦肩而过,并相约一场采访。通过采访,我深深的感受到他对行业的执着与热情,他将音视频技术定义为互联网品质生活的连接器,而我们这些社区媒体不也是这些开发者与生态的连接器吗?
Zoe Liu:被Chrome Media团队的专注精神感染
在WebRTCon 2018期间,Google软件工程师Zoe Liu接受了LiveVideoStack社区编辑丁雪丰的采访。Zoe畅谈了AV1及VP9的现状与应用前景,以及从On2到Chrome Media坚持20多年做编解码研发的团队。
腾讯视频全网清晰度提升攻坚战
腾讯视频移动端播放内核技术负责人李大龙围绕Codec,详细解读了腾讯为提升视频质量做的种种工作,包括播放器、编码与解码端、Codec优化、AI内容分类等。本文来自李大龙在LiveVideoStackCon 2017大会的分享,由LiveVideoStack整理。
张琰彬:聊聊视频质量自动化测试
对于大部分海量视频平台和需要持续交付视频服务的平台而言,采取视频自动化测试是唯一可行的选择。在WebRTCon 2018期间,英特尔Intel® Collaboration Suite for WebRTC (面向WebRTC 的英特尔® 协同通信开发套件)客户端测试架构负责人张琰彬接受了LiveVideoStack的采访,详细阐述了视频视频质量自动化测试的难点及应对方案。
曾小伟:谁没被“不可思议”的薪资吸引过?
在我经历的上百场技术分享中,将分享打印成演讲稿的讲师寥寥,一共有3次。曾小伟的分享是其中一次。事实证明,这种“愚笨”的方法不仅令身为组织方的我十分感动,而且实际的输出效果也是不错的。在曾小伟“LiveVideoStack Meet上海:多媒体开发新趋势”的分享后,我们相约做一次邮件采访。在采访中,他聊起了自己的入行经历,被技术的深度和广度困扰过,也被互联网金融“不可思议”的薪资吸引过。他还说,做的越多,越觉得自己无知。他是,曾小伟 PP云技术副总监。
从直播答题看背后的移动音视频开发
直播答题经历了火山喷发式的火爆,展晓凯和他的团队也经历了在短短数周内完成产品开发、测试、上线、运营、迭代的过程,他从产品逻辑、技术实现、难点突破等方面给出了自己的方案与经验。本文来自全民快乐研发高级总监展晓凯在2018年1月《LiveVideoStack Meet:移动音视频开发进阶暨新书分享会》上的分享,活动邀请了展晓凯新书《音视频开发进阶指南》的粉丝参与。
FFmpeg 硬件加速方案概览 (下)
被称为“多媒体技术领域的瑞士军刀”,FFmpeg拥有广泛的应用基础。不过,当(实时)处理海量视频时,需要借助各种方法提升效率。比如,短视频平台Revvel将视频转码服务迁移到AWS Lambda和S3上,节省了大量费用和运维成本,并且将时长2小时的视频转码从4-6小时缩短到不到10分钟。本文将纵览FFmpeg的硬件加速方案,涉及各主流硬件方案和操作系统。本文为此系列的下篇。
孙俊伟:60帧帧率、4K分辨率是视频会议的趋势
视频会议是一个传统又新兴的行业,新技术正在逐步得到应用。LiveVideoStack对华创视讯研发主管孙俊伟进行了采访,畅谈了视频会议系统的难点与发展趋势。他表示,60帧帧率、4K分辨率是视频会议的趋势,而芯片仍然高度依赖海外供货。在5月19日开幕的WebRTCon 2018上,孙俊伟将分享《探索高并发视频会议服务》。
吴涛 :低延迟传输协议和新Codec将成为热点
和许多沉浸在多媒体行业多年的技术人一样,吴涛也经历了十多年的摸爬滚打对这一行业不离不弃。用他的话说,没有离开是因为“惰性”。他说,自已远未达到脱颖而出的境界,只是将所学技术和经验学以致用。LiveVideoStack邮件采访了陌陌视频流媒体技术负责人吴涛,畅聊了自己的成长经历和业界热点话题。
从奔腾I的VCD播放到AI区块链播放器——程序优化的魔法
从上个世纪本腾I电脑播放VCD,通过巧妙的算法优化,可以在损失部分效果的情况下在低性能的电脑上播放VCD。时至今日,硬件性能大幅飙升,许多算法近乎“失传”了。但对于充满好奇心的程序员,研究这些算法能够更加了解多媒体底层实现原理。本文是资深多媒体开发工程师鲍金龙在《移动音视频开发进阶暨新书分享会》上的分享整理而成。谨以此文向鲍金龙这样还在一线开发的多媒体老兵致敬。
技术人凭什么那么骄傲?谢然:给自己开发工具
在紧张的研发工作之余,谢然喜欢跑步、看书、打游戏,也看B站。为了能够解决Mac看B站发热的问题,自己开发了工具来支持,可谓“学以致用”。LiveVideoStack邮件采访了七牛直播云流媒体负责人谢然,聊到了工作、技术与个人兴趣。
学习多媒体开发的正确姿势?陈功:看书 啃代码 搞插件
陈功说,要想学好多媒体开发,首先需要兴趣,接下来还需要好的方法。LiveVideoStack邮件采访了声网Agora首席WebRTC架构师,畅聊了自己的成长经历,WebRTC的演进趋势等。陈功表示,WebRTC的未来值得期待。
搞多媒体开发?吴威麒:先拉个书单看看
从2017年4月22日一场LiveVideoStack活动开始,每次活动都会选1-2本技术图书作为奖品。我们相信阅读这件事情“从来都不晚,一直都有用。”大多数技术牛人都推荐研究开源项目的源码,勤看论文,但推荐高质量的多媒体开发领域的技术图书并没有达成共识。本文是对触宝科技音频技术专家吴威麒的邮件采访,他非常详尽的推荐了多本多媒体开发经典图书。
章琦:能坚持的唯一的原因就是兴趣
从虹软、思科再到唐桥,章琦一直在关注视频编解码和实时通信开发。作为架构师,他认为软件设计和下围棋一样,都是“简单细胞组合成复杂艺术作品”的真实体现。LiveVideoStack邮件采访了唐桥科技首席架构师章琦,畅聊了自己成长的过程,以及对多媒体技术生态未来的看法。
盛骁杰:对于充满好奇心的技术人来说多媒体技术是个宝藏
随着VR视频的普及,越来越频繁的出现在公众视野,相关标准、优化改进都在按部就班的推进中。随着5G商用临近,将助力VR视频进一步普及。LiveVideoStack邮件采访了优酷VR技术专家盛骁杰,畅聊了个人的成长经历,VR视频标准的演进、技术难点,以及未来应用前景的展望。
老猴回顾十年多媒体关键词:高清,内容,开源,快
认识老猴(侯金亭)是在去年的LiveVideoStackCon的晚宴上,十分健谈,在低调内敛的技术人中格外扎眼。他说,从没想过为啥要从事这个行业,也从来没有想过要离开,好像一直在这儿似的。于是就这样沉浸在多媒体行业十多年。LiveVideoStack对北京理光软件研究所战略执行部副总监侯金亭进行了邮件采访,畅谈了多媒体行业发展的过去与未来。
董海冰:2018风云再起 ,期待AV1、AI和AR
从CCTalk、途牛再到TutorABC,董海冰带领他的团队攻下一个个战略要地。他说:兵无常势,水无常形。兵不在多,小团队也往往能改变整个战局。他还说,要拥抱开源和DevOps,多泡GitHub,努力追寻“心的方向”。LiveVideoStack邮件采访了TutorABC研发总监董海冰,畅聊了自己作为一名技术人的历程。
刘连响:一切都是最好的选择
第一次见到刘连响是在CSDN组织的技术沙龙上,从此,这个总是一身朋克打扮的年轻人就成为LiveVideoStack的常客。他活跃在各种技术群中,分享自己发现的新工具、新方法。作为一名痴迷于技术的创业者,压力和挑战如影随形。LiveVideoStack对刘连响进行了邮件采访,从大学里不顾旷课而泡在图书馆学习Flash,到来到北京寻找实习机会。他说,这一些都是最好的选择。
FFmpeg 硬件加速方案概览 (上)
被称为“多媒体技术领域的瑞士军刀”,FFmpeg拥有广泛的应用基础。不过,当(实时)处理海量视频时,需要借助各种方法提升效率。比如,短视频平台Revvel将视频转码服务迁移到AWS Lambda和S3上,节省了大量费用和运维成本,并且将时长2小时的视频转码从4-6小时缩短到不到10分钟。本文将纵览FFmpeg的硬件加速方案,涉及各主流硬件方案和操作系统。感谢英特尔资深软件开发工程师赵军的投稿。
P2P技术如何拯救一家直播网站
众所周知运维成本是直播网站最大的成本组成,运维成本则主要体现在带宽,而伴随主播与用户对视频清晰度以及连麦的需求不断提升,直播带宽也在与日俱增。本文整理自学霸君音视频技术负责人袁荣喜在LiveVideoStackCon 2017上的分享,通过实践案例讲解了如何使用P2P技术将带宽和延迟降低到传统技术的1/3,并详细介绍了P2P分发算法的架构设计和技术实现细节。
Fountain Codes:为雾计算CDN赋能
海量节点CDN正在成为内容分发领域的新实践,它能撬动近乎无限的带宽和存储资源,部署下沉至用户身边,从而彻底解决内容分发中“最后一公里”的问题,然而组网节点运算能力弱、上传带宽小、在线时间不稳定也带来很多挑战。本文是上海云熵网络科技有限公司联合创始人、CTO刘炜在LiveVideoStackCon 2017上的演讲整理,简述了Fountain Code的原理和实现,并介绍如何利用它为海量“弱”节点赋能,在不稳定的节点之上打造一个稳定、高效、低成本的直播分发网络。
WebRTC:并非解决音视频应用所有问题的银弹
WebRTC 1.0标准虽然已经定稿,但各个浏览器的实现都还不成熟,处于快速迭代中,网易云信CTO赵加雨针对实时通信技术演进、WebRTC国内外发展与趋势、以及开发难点和不足做了详细分析。本文是『WebRTC-互联网音视频新标准?』系列的第四篇。
深度学习在视频分析中的架构、算法及应用
直播与短视频业务的兴起,代表了一种内容交互方式的变化,更加追求强交互,这种变化催化了很多技术和架构的转型,由传统的传输、存储优先演进为计算与智能。本文是由360人工智能研究院视频大数据组技术负责人陈强在LiveVideoStackCon 2017上的演讲整理而成,分享了深度学习在视频业务中的一些实践案例,并由点及面介绍了相应的实现架构、算法与应用。
展望2018:WebRTC大规模商用元年
历经6年长跑,WebRTC终于在去年迎来了1.0标准(candidate recommendation)的发布,而它也将成为2018年视频通信商业应用场景爆发的主要技术推动力。一站式WebRTC通信技术提供商Zealcomm公司创始人、CEO冯昶对WebRTC在国内外发展历程、行业趋势、技术难点和未来发展做了详细的分析。本文是『WebRTC-互联网音视频新标准?』系列的第三篇。
腾讯音视频实验室:基于音视频细分场景的技术创新探索
音视频通讯能力作为标配渗透到了各个行业,腾讯音视频实验室音频技术负责人郭亮在LiveVideoStackCon 2017上分享了腾讯音视频实验在流畅无卡顿、回声消除等音频前处理、网络部署与覆盖等各个技术上的深度解析,以及前沿技术创新在音视频场景中的实践,本文为分享的整理。
下一代编解码标准的抉择
2018年的第一个月对于编辑码标准生态而言很不平静,Apple加入AOM联盟支持AV1,国产的AVS2宣布开源,MPEG创始人、主席Leonardo Chiariglione发文表示“MPEG商业模式已经破裂” 。尽管AV1和AVS2走向成熟还需时日,但至少让用户有了更多选择。Hulu全球高级研发经理傅德良撰文分析了各主流编解码器的优势与不足,并对编解码器的选择给出了自己的建议。
高品质互动在线课堂:前端开发优化实践
互联网教育行业风起云涌,而高品质在线授课平台是每个互联网教育公司的核心和基石。本文是tutorabc前端负责人和君在LiveVideoStackCon 2017上的分享整理,主要介绍了在线授课系统Tutormeet+前端开发实践,包括技术选型、性能优化、持续交付实践以及APM系统。
揭秘熊猫TV HEVC直播
尽管HEVC(H.265)在2013年就完成了定稿,但直到去年苹果才宣布在iOS 11上支持HEVC。在封闭的苹果生态下,新的Codec应用还用了4年时间,何况其他开放的生态系统呢。2018年初,熊猫TV宣布开始支持HEVC直播间,虽然这次升级主要帮助运营方节省带宽成本(20%以上),但未来将会在移动端投屏下切换至更高的码率,提升用户端观看体验。作为本土主流的游戏直播平台,熊猫TV在新技术创新方面走在了同行前列,也给行业提供了实践参考。LiveVideoStack邀请熊猫TV CTO黄欢和金山云算法总监朱
王立众:学习多媒体开发从编解码开始
认识王立众,是通过一位热心的读者引荐,一番波折后才有了此文,这也是『下一代编解码器』系列采访的第9篇。随着云平台服务的普及,大多数多媒体开发者并不需要了解底层技术。但如果有兴趣扎根于多媒体技术,就需要学习底层技术,而编解码器则是关键的一环。中国三星研究院的音频研发负责人王立众通过LiveVideoStack分享了音频编解码器生态的方方面面。
展望2018:WebRTC技术现状、应用开发与前景
2017年,苹果宣布将在iOS 11中支持WebRTC,至此完成了主流PC浏览器、移动端的全覆盖,而其提供了一整套完备的音视频通信方案,这给开发者带来了巨大利好。英特尔协同通信解决方案架构师段先德针对WebRTC的能力、优势与不足、开发要点及未来发展几方面进行分析。本文是『WebRTC-互联网音视频新标准?』系列的第一篇,如果您对WebRTC技术的未来有分析和洞见,欢迎联系 contribute@livevideostack.com。
“抖音”式的酷炫短视频开发进阶
2017年短视频应用的爆发,再次改变了人们,尤其是年轻人的生活习惯,快手、抖音等应用也逐渐融入到日常生活中。短视频App各种各样的酷炫效果让人爱不释手,也把视频内容玩出了新花样。LiveVideoStack邀请了全民快乐研发高级总监展晓凯,与我们线上分享了短视频酷炫特效的实现设计架构、解决思路和开发经验,本文是直播分享的内容整理。
人工智能在视频应用领域的探索
人工智能热度很高,但泡沫也很大。人工智能在视频领域的应用已经走入寻常人的生活,人脸识别,视频自动抠像技术已经比较成熟。除此之外,人工智能还能为视频应用带来哪些变化呢?鲍金龙撰文,描述了人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等。如果你在某一领域有深入探索与洞察,欢迎联contribute@livevideostack.com。
王荣刚:视频画质评定是个“大坑”
这是『下一代编解码器』系列采访的第8篇,LiveVideoStack采访了北京大学信息工程学院教授王荣刚,畅聊了从热门编解码器的比较到4K、短视频等应用场景,国产AVS2的演进,以及视频画质评定。
短视频客户端SDK设计与实现
直播与短视频相继爆发,也促使众多企业纷纷加入其中,对于许多传统企业和中小企业而言音视频开发成为了最大难点,而视频云客户端SDK也就无疑成为了不错的选择。本文是全民快乐研发高级总监展晓凯在LiveVideoStackCon 2017上分享的整理,主要从架构设计、模块的拆分实现、跨平台视频处理系统和推流系统的构建几部分着重介绍。
谷沉沉:专注视频技术十几年
和许多编解码器玩家一样,谷沉沉在视频领域深入探索了很多年。在腾讯十年从间,历经各个产品的,但都没有离开音视频领域。这是『下一代编解码器』系列采访的第7篇,LiveVideoStack采访了腾讯微信多媒体团队专家研究员谷沉沉,向我们讲述了自己的“音视频”十几年。
宋利:编码既是技术也是艺术
“好为人师,博而不精,杂而不纯。”——宋利。 收到对宋利的采访邮件,正文开始是一段自嘲,让原本枯燥的技术采访变得生动。相比于之前几个采访,本文的信息量更大,不得不对严谨的学术界敬佩三分。本文是『下一代编解码』系列采访的第6篇,邀请到了上海交通大学任研究员,博士生导师宋利,他全面的解读了编解码器的现状与未来趋势。
朱政:编码压缩效率带着魔性
带领团队挑战H.265编解码性能极限,并在全球编解码大赛中取得前两名的成绩,过去十多年,朱政一直深耕于多媒体研发领域。他说,编码器的压缩效率有一种魔性,工具、算法再加上实验和运气。本文是『下一代编码器』系列采访的第三篇,金山云算法总监朱政接受了LiveVideoStack的邮件采访,畅谈了自己的成长经历,以及对编解码技术的理解。
AV1:为互联网提供开放、免费的视频编解码工具
从学术研究到进入工业界,Zoe Liu一直在算法和音视频领域,目前在谷歌编解码团队为编解码器AV1做开发支持。Zoe畅谈了评定编解码器的标准,以及AV1的最新进度。本文是『下一代编码器』系列采访之一,欢迎自荐或推荐技术人加入『下一代编码器』系列采访,请邮件editors@livevideostack.com。
郑鹏:大鹏一日同风起
有这么一类人,你会形容他很犟、很作、爱钻牛角尖、死脑筋、“不撞南墙头不回”,但你却不曾发现,档在他前进路上的那一堵堵“墙”都被他撞烂,我曾经以为“永远争第一”只是一句空洞的口号,但他却用“全力争胜”给了我悍然一击,他就是我们的主人公—郑鹏。
陈科吉:学习编解码分三步走
从2009年进入北京大学计算机科学技术研究所,陈科吉开始接触视频编解码,并一步步成为独当一面的专家。LiveVideoStack有幸和陈科吉进行了邮件采访,畅谈了编解码领域的热门话题,并给初学编解码的同学总结了经验。本文是『下一代编码器』系列采访的第二篇。
赵丽丽:好奇和成就感是前进的永动机
出于对计算机的好奇让她走进了技术的大门,源于“发现问题&解决问题”带来的成就感让她在这条道路上不断前行,态度是做事的基石,方法论是成功的关键,她向我们诠释了“谁说女子不如男”,她就是我们的主人公——赵丽丽。
赵军:与driver搏斗痛之所在亦乐之所在
做多媒体开发,编解码器是绕不过的坎。有那么一拨人,想方设法的提升编解码器的效率,执着向前。本文是『下一代编码器』系列采访的第一篇,Intel资深软件开发工程师赵军畅谈了编解码器的发展规律,Intel在FFmpeg的优化工作,以及下一代编解码码器AV1的机遇和挑战。
刘歧:“走弯路”的大师兄
从蓝汛、高升、金山云到创立OnVideo,“大师兄”在而立之年完成了一个技术人的华丽转身。创业对于技术人而言的挑战绝不仅仅是写代码那么简单,所有事情都需要亲力亲为。即便如此,你仍然可以看到在各种技术群里,在FFmpeg的maillist里,“大师兄”的及时反馈和热心解答。