作为一个音视频多年开发的老兵,把我觉得最好的一些书籍整理出来,按最小系统原则,把音视频每一个分支领域最好的参考书籍,推荐1~2本给大家。希望阅读这些参考书籍,是熟悉音视频概念的最佳路径;希望读完这些参考书籍,你能成为这个行业的最佳手艺人!


第三篇:专业技术篇

第一本:《小波与傅立叶分析基础》

Albert Boggess 和 Francis J. Narcowich 写的著作。

傅立叶分析在工科学科里,起着很重要的作用,但是大学里没几个人把这门课真正学好。一来傅立叶分析本身是很抽象的概念,二来更致命的是教材问题,我自己读过几本中国式傅立叶分析教材,感觉就是:枯燥、抽象、机械、教条。工科里的复变函数和积分变换教材,更多是命令式教育,直接上来罗列定义、定理,示例过少,没有把来龙去脉讲清楚,缺乏数学直观上的理解与表述;指望初学者自己搞清楚频域世界观,根本不现实。

我这里推荐的这本书就避免了这个问题,从傅立叶分析所需要的基本数学概念入手,以简洁明了的方式,把傅立叶级数、傅立叶分析介绍清楚,薄薄的一本书,能做到可读性好、知识全面系统,真不容易。

对于现在音视频处理来说,小波基本应用很少,所以,如果你时间有限,本书读完一本即可,小波那部分可完全看兴趣。

第二本:《数字信号处理》Lyons版本

在音视频里,数字信号处理是最基础的算法基础,基本上所有的算法原理,都是围绕着数字信号处理的原理来深入的。

如果我们上豆瓣或是京东,以关键词《数字信号处理》来搜索,书籍起码有成百上千本吧?有各位专家的专著,也有各个高校的教材,有国外经典教材也有国内教材,数量如此繁多,足见这门学科的基础性和重要性;而教材的差异化如此之大,也足见这门学科的博大精深。

在这里,我要强烈推荐的是 Lyons 的版本,而恰恰让我觉得奇怪的是,如此好的教材,豆瓣点评很少,为什么在国内不怎么有名气呢?

本书足够简单、释疑,把很多一直以来的疑问都解释清楚。这本书,可以在看完第一本书后,仔细看,对于理解数字信号处理以及傅里叶分析会有很直观的理解。

看得出来,本书不是理论派写的,而是工程师写的,也是为工程师准确的,里面大量直观的图表示例。

作为需要动手的工程师,最建议读的就是这本书。

第三本:《统计信号处理基础—估计与检测理论》

作者:Steve M. Kay

现代工科有一个很重要的部分,就是不确定性理论,说直白一些,就是统计学在信号及系统方面的应用。现实世界中随机噪声无处不在,使得基于确定性信号处理方法获得的结果缺乏理论基础,因而基于统计量的信号处理方法获得了越来越多的研究和应用。从统计角度出发,对混有随机噪声的随机过程进行处理的过程,通常称为估计,而从某种意义上,使得估计结果最接近被估计量的真值,则称为最优估计。显然,这里的"最优"是有特定意义的,即从不同的角度出发,都可以称为"最优",但各个最优结果之间可能会有一定的差异。

学习这门课程之前,一定要有很好的概率论知识,有关概率与统计学的书评,可以参考我之前写的统计学书评《概率与统计学书籍点评》

我把能找到的有关统计信号处理的书,都翻过一遍,有一些我认为写得很好并且仔细地精读,有一些写得一般我也随便翻翻看看有没有什么惊喜。如果统计信号处理一定要推荐一本书的话,那必须就是这本!需要有一定的概率和随机过程数学基础,建议学习之前找一本概率与统计的书系统地啃一啃。

全书条理结构清晰,把学科脉络介绍得很全面,直觉与深刻并存,适合自学和建立学科大局观。总体来说,对统计信号处理的学科背景介绍得比较充分,循序渐进,并且忽略部分理论推导的细节,比较直观,入门好书。

全书很长,分三卷,不过读起来很快。

这里特别提一下卷三《统计信号处理基础–实用算法开发(卷3)》,如果你是工程师,这本一定要精读,所有工程实现的精华与思想,甚至包括人生哲理都包含在这本书里。

如果要推荐第二本统计信号处理教材,那必须是这套书的卷三。卷三相比传统理论书籍有几个优点:

  1. 有大量实际的算法参考,作者强调动手实现;
  2. 对开发算法哲学有严格的表述;
  3. 务实不学究,不堆砌数学公式。

如果非要对本书挑缺点,那就是翻译文字太生硬,一定要找英文版来看。

PS:有关学习方法再啰嗦一下:还是那一句话,挑一本好书,啃完,多啃几遍,再找几本书补一补,切忌什么书都翻一翻,那样效果最差。

第四本:《离散时间语音信号处理: 原理与应用》

如果你是做视频相关研发工作,则不用看这一部分内容,这一本书是为做音频的同学准备的。

音频的大量工作,是集中在音频的前后处理上,反而在音频编解码占的戏份不多。

音频处理的书籍相对较少,好书就更少,市场上有关音频信号处理的书籍,我基本上都翻了翻,在这里,我推荐这本夸特尔瑞著的《离散时间语音信号处理》

本书是音频信号处理概念与经典算法的介绍,把本书读懂,基本音频相关概念都熟悉,以后不管是做传统算法优化,还是做AI音频算法,应该从原理上来讲,都不会有什么困难。

唯一困难的是,这本书已经绝版,各位同学可以上网找找电子版然后打印出来看;如果不想看盗版书籍,也可以尝试看看Lawrence R. Rabiner的《数字语音处理理论与应用》,这本书整体内容质量差一些,翻译也一般,不过也算是一部优秀的著作。

第五本:《数字图像处理》

如果你是做视频相关业务,那不用看第四本书,直接看这一本。

音视频业务里,有涉及到大量的前后处理技术,这部分和音视频编解码没有直接关系(相关的处理可能会影响视频编码的效率)。而视频的基础是一帧帧的图像,基本的图像处理任务,可以看成是视频编码或是视频处理的前身,而图像的处理,有着最基本的概念与原理,也是自成体系的一门学科,必须系统学习。

学习图像处理,必须看这个领域最最经典的书籍。冈老先生的这本《数字图像处理》,估计是不少学校的教材,也是很多图像处理入门教材。本书对图像处理最基本的概念、方法、原理作了介绍,并且没有太拘泥于信号处理方法的原理,更多强调从直观上理解原理,是该领域的代表作品。

重要的事情说一遍:本书必须看英文版本,中文翻译版本语句太差是没法读的。

把这本书读懂了,碰到了相关的图像处理或是计算机视觉问题,就可以直接看各种的论文,以及查阅相关的专著。

这本书并不包括现代图像处理方法,比如说深度学习相关的处理方法,但是当你掌握了最最基本的方法与概念后,再加上一点点深度学习理论,你应该能驾驭图像处理的现代方法。

第六本:视频编解码

视频编解码是音视频里的重头戏,并且也是相对独立的技术体系,有大量的视频标准、会议、资料可供查阅。

现在不比十年前,视频编解码的资料已经非常丰富,各细分领域的讨论也多。我这里推荐入门书籍的原则,依然是简单、快速、轻薄。

最早做视频编码的同学,估计是看毕厚杰的书入门,现在很多人可能会推荐杨付正的H.265编码教材,不过呢,我自己更喜欢这本:《The H.264 Advanced Video Compression Standard》,Richardson著(我习惯称之为"理查的书")。H.264依然是当今世界上最成功的视频标准,也依然是应用最广泛的视频标准之一,从H.264入门视频编解码,原理足够简单,而应用内涵又足够丰富。

这本书虽然是英文版,但是语言简洁明了,英文很地道非常易读,读起来简直就是一种享受。这本书一个优秀的地方,是对一些片断,比如熵解码、预测等提供一些样例数据,你如果有兴趣的话,完全可以自己动手用 Matlab 或是 Python 来计算一下,看自己的理解对不对。

本书除了对原理进行介绍外,还对一些应用作了介绍。本书还有一个最大的优点:薄!

作为视频编码入门的不二选择,建议作为第一书,仔细精读一遍。从H.264入门视频编码,总是不会错的。

如果你对读英文原著有恐惧,想挑一本中文书籍入门视频编码,我推荐你从H.265开始学习,杨付正的《新一代高效视频编码H.265/HEVC:原理、标准与实现》或是朱秀昌的《H.265/HEVC–视频编码新标准及其扩展》都是不错的选择。

读完这些入门书籍,那接下来,就是动手做项目,再有疑问,就是查阅相关视频编码标准文档。

附书籍详细信息:

  • [1] Boggess, Albert, Francis J. Narcowich, 芮国胜, and 康健. 小波与傅里叶分析基础. 北京: 电子工业出版社, 2010.
  • [2] Lyons, Richard G., 张建华, 许晓东, and 孙松林. 数字信号处理. 北京: 电子工业出版社, 2015.
  • [3] Kay, Steven M. and 罗鹏飞. 统计信号处理基础: 估计与检测理论 (卷I, 卷II合集). 北京: 电子工业出版社, 2014.
  • [4] Kay, Steven M., 罗鹏飞, 张文明, and 韩韬. 统计信号处理基础 卷III. 北京: 电子工业出版社, 2018.
  • [5] 夸特尔瑞, Atieri Qu, and 赵胜辉. 离散时间语音信号处理: 原理与应用. 北京: 电子工业出版社, 2004.
  • [6] Lawrence R. Rabiner and Ronald W. Schafer. 数字语音处理理论与应用. 北京: 电子工业出版社, 2016.
  • [7] Gonzalez, Rafael C, and Richard E Woods. Digital image processing. 北京市: Publishing House of Electronics Industry, 2010.
  • [8] Richardson, Iain E. G. The H.264 Advanced Video Compression Standard. 2. ed. Chichester: Wiley, 2010.
  • [9] 万帅 and 杨付正. 新一代高效视频编码H.265/HEVC: 原理, 标准与实现, 2014.
  • [10] 朱秀昌, 刘峰, and 胡栋. H.265/HEVC: 视频编码新标准及其扩展. 北京: 电子工业出版社, 2016.