请教一下, AirPods Max, AirPods Pro,空间音频, 5.1, 7.1 声道,杜比全景声这类的东西。。。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
intellectual
V2EX    耳机

请教一下, AirPods Max, AirPods Pro,空间音频, 5.1, 7.1 声道,杜比全景声这类的东西。。。

  •  
  •   intellectual 2020-12-14 02:40:33 +08:00 5185 次点击
    这是一个创建于 1810 天前的主题,其中的信息可能已经有所发展或是发生改变。

    耳机上的 5.1,7.1,以及全景声,环绕声,绝大部分都是虚拟全景声,毕竟耳机不可能按这么多喇叭。

    像现在降噪的 sony 1000x 系列,bose qc 35 系列,他们为什么不也自带个虚拟 5.1,7.1,全景声,环绕声?而只有左右声道?我在用 1000x 接 Mac,有试过一些 5.1,7.1 的音频测试文件,老实说,.1 这个重低音声道其实听不见,这等于是无法播放 5.1 等的音频么?

    反而有些耳机,甚至二三十块钱的耳机,还都做了 7.1 声道。这到底是。。。?

    所以也不知道用 1000x 还有 AirPods pro 看一些本地视频文件的时候,声音到底损失了多少?

    蛮期待有个大神科普一下,或者丢个链接也好。感谢。

    第 1 条附言    2020-12-14 12:22:41 +08:00
    我疑惑的又一个点就是,用 iina 打开了下载的 8 个 g,或者 16 个 g 的迷你蓝光 mkv 影片。这个 mkv 里面包含了已经压缩了的 7.1 声道的音频,通过 iina 播放出来,最终传到用蓝牙连接的 airpods pro 立体声耳机里面,不知道音频会损失啥吊样?音频损失有多少?百分之几?百分之几十?我因为不懂所以只好盲猜了。。。
    我只想请教下这个里面损失的音频会不会很夸张,各位土豪就没必要说让烧音响啦,或者这个需求很搞笑之类的。。。谢谢谢谢
    第 2 条附言    2020-12-14 12:37:41 +08:00
    ### 关于这类实现技术之自我逻辑补全的瞎猜:

    5.1 声道至少需要 6 个喇叭,再后来到环绕音十几个喇叭,再到全景声二三十个喇叭。这似乎是正常杜比音效的配置。而耳机不可能弄这么多喇叭,这大概可以猜出来两个喇叭的耳机肯定是虚拟的。这是我凭空想的,当然也是需要看看别人说我的对不对之类的。
    再瞎猜一下,一个 mp3 文件几 MB,而一个 DTS 文件,甚至 1 个 G 。可见这里面记录音源信息满多的。把 1 个 G 的 DTS 音频文件播放到二三十个喇叭的全景声上面,跟播放在只有两个喇叭的耳机上面且还要满足杜比虚拟环绕声的标准,这个肯定是私密收费专利技术了。我只能瞎猜这么一些了。
    传输这种大小的数据肯定不能指望蓝牙了,所以有那种 2.4GWi-Fi 的无线耳机,我知道个罗技 933 这类的,然后再买个杜比的芯片,这个芯片封装了杜比环绕音的解决方案。把音频数据源通过播放器播放,然后通过 2.4GWi-Fi 传到罗技的杜比芯片,通过杜比芯片这个黑匣子来解析环绕音到人的耳朵。我只能做这样的猜测了。

    ### 第三方小厂对这类的处理。
    游戏开发者肯定在游戏输出的时候也根据游戏引擎做了声道划分,然后交给声卡,声卡交给耳机。当然这些声卡可能有 5 块钱的不知名牌子也能解析 7.1 声道的声卡,也有 5 千块比如杜比认证这类的“完美”声卡。这又是我的一个猜测。
    同理,100 块的诺基亚 1100 也能打电话,1w 块的 iPhone 12 pro max 也是一样打电话。反正至少打电话的功能是一样的。

    你看,我猜的好像还满通顺的把。没准说不定也全都是错的。
    第 3 条附言    2020-12-14 12:44:27 +08:00
    其实我想确认下,那种多声道的耳机,看电影玩游戏是不是比只有两个声道的耳机强。而且,有的几十块钱的耳机也有 7.1,最新 AirPods Max,都 4k 多了,竟然还是双声道立体声。这让人很困惑,一时半会没有明白这是咋回事。当然看得出来,我这通篇问题问的比较糊涂,的确不是个合格的问题。让人有点不知所云。
    经过下面一位朋友推了一把,我索性自我逻辑强行疏通了一下,瞎扯了一通,也算至少明白我要干嘛了。
    刚才给天猫罗技客服咨询下,客服给了我个他们 400 技术的电话,这也是没见过我这种傻帽顾客吧。算了,一会请教一下罗技技术。
    16 条回复    2020-12-14 15:19:13 +08:00
    nvkou
        1
    nvkou  
       2020-12-14 02:55:27 +08:00 via Android
    认真做耳机的怎么实现我不知道,但地摊货支持一般是芯片支持输入信号,但怎么驱动单元他们不曾想过。
    xuegy
        2
    xuegy  
       2020-12-14 04:44:43 +08:00 via iPhone
    苹果的空间音频是不是在手机上处理好的?蓝牙最多只能走立体声啊
    love4taylor
        3
    love4taylor  
    PRO
       2020-12-14 08:10:35 +08:00   1
    idealhs
        4
    idealhs  
       2020-12-14 08:39:35 +08:00
    你两只耳朵,耳机一边一个,当然是双声道就够了。多声道对于耳机来说,只是输入多声道,苹果给你模拟了个使用多声道音箱的效果。这个 sony 其实也有,你真的用过 sony 1000x 吗,下个 app 看看里面有个 60 reality 的效果。
    Xusually
        5
    Xusually  
       2020-12-14 09:47:15 +08:00   2
    @idealhs sony 的 360 reality 不能补偿头部运动,Apple 的可以固定屏幕和音源位置。
    比如你看个电影,声音主要从右边传来,如果用 sony 的,你转身到背后,那么声音还是在你右侧耳机出来。但是用 Apple 的话,你会发现声音固定在原来的位置,你转身到背后的话,声音会从左边出来了。
    你用一下就知道了。
    intellectual
        6
    intellectual  
    OP
       2020-12-14 10:01:07 +08:00
    @idealhs 我是第一代 1000x,不能连 app ,不过我用一些测试多声道的软件,.1 那个声道的就没声音。总感觉看电影的话不知道损失了多少效果。。。理科生么,有些东西总想研究一下。毕竟双声道设置里面只有左和右,看的某些视频里面 win 下面的一些耳机属性就有 7 个声道。。。


    @Love4Taylor 感谢老板提供的链接
    idealhs
        7
    idealhs  
       2020-12-14 10:51:51 +08:00
    @Xusually 我都有,用过的体验就是,Airpods Pro 看上去很吊,其实声场不跟随头部运动这个功能实在没什么用得到的地方。360 Reality 更是鸡肋,并不会用得到。想赋予耳机更多空间感,是要有源媒体配合的,比如 csgo 的空间声音优化。想玩多声道就别盯着耳机,多声道就是音箱玩的。
    0A0
        8
    0A0  
       2020-12-14 11:49:51 +08:00 via Android   1
    你这个问题看起来问的简简单单,是呀,为啥呢。
    但是要真回答起来的话差不多就是篇论文了。其中很多技术谷歌一下完全都可以找得到。

    最最最简单的总结来说,声音从手机里的数字信号,最终变成模拟信号给驱动单元,耳机只有 lr 两个。

    那想做立体声就必定是要在数字信号转换成模拟信号之前动手脚,通过算法的计算模拟出多声道效果,再输送给驱动单元。果子的空间定位,是因为耳机里有陀螺仪,加速计等传感器的帮助,可以在 h1 芯片的算力下实时算出你移动的距离,范围等信息,然后对已经被处理成多声道的信号进行补偿和修正来达到“定位”。

    换句话,摸摸多声道,是设备端在算,实时空间定位,是耳机在算。只有当两个都在疯狂计算并协同配合下,才能实现能空间定位的模拟多声道效果。
    为什么别家不做,因为这其中最重要的,就是算法。而果子的算法,的确先进,且不公开。

    至于地摊货,只是刚好沾了芯片自带支持虚拟环绕而已。因为算法不行,所以效果不好。

    懂了吗我的小可爱。多看看文档,再不济漫天盖地的测评 up 也能了解个大概哟。
    dxgfalcongbit
        9
    dxgfalcongbit  
       2020-12-14 11:55:34 +08:00 via Android
    耳机的虚拟环绕声技术一般是配合游戏使用的,看电影听音乐的话在制作音频的时候已经把虚拟环绕声做进去了不需要耳机回锅,而且这两种场景耳机也收集不到必要的信息来生成虚拟环绕声。
    intellectual
        10
    intellectual  
    OP
       2020-12-14 12:08:32 +08:00
    @idealhs 哈哈哈,,好的好的,后面再烧音响吧,大不了先买个乞丐罗技游戏耳机也能凑合,这个多声道至少还是算个标准吧。目前就是 mac+耳机,PC+耳机,用到多声道主要是看电影和游戏,没有音响的习惯。
    intellectual
        11
    intellectual  
    OP
       2020-12-14 12:14:14 +08:00
    @0A0 好的,我其实也能大概猜到是这类的情况。查资料有时候其实满难的,毕竟一些关键词不太懂。比如 5.1 至少需要 6 个喇叭,再后来到环绕音十几个喇叭,再到全景声二三十个喇叭。这大概可以猜出来两个喇叭的耳机肯定是虚拟的。这是我凭空想的,当然也是需要看看别人说我的对不对之类的。
    喇叭的问题搞定了还有个算法问题。再瞎猜一下,一个 mp3 文件几 MB,而一个 DTS 文件,甚至 1 个 G 。可见这里面记录音源信息满多的。把 1 个 G 的 DTS 音频文件播放到二三十个喇叭的全景声上面,跟播放在只有两个喇叭的耳机上面且还要满足杜比虚拟环绕声的标准,这个肯定是私密收费专利技术了。我只能瞎猜这么一些了。
    这种传播肯定不能指望蓝牙了,所以有那种 2.4GWi-Fi 的无线耳机,我知道个罗技 933 这类的,然后再买个杜比的芯片,这个芯片封装了杜比环绕音的解决方案。把音频数据源通过播放器播放,然后通过 2.4GWi-Fi 传到罗技的杜比芯片,通过杜比芯片这个黑匣子来解析环绕音到人的耳朵。我只能做这样的猜测了。

    第三方小厂对这类的处理。比如游戏,游戏开发者肯定在游戏输出的时候做了声道划分,然后交给声卡,声卡交给耳机。当然这些声卡可能有 5 块钱不知名也能解析 7.1 声道的声卡,也有 5 千块比如杜比认证这类的“完美”声卡。这又是我的一个猜测。
    同理,100 块的诺基亚 1100 也能打电话,1w 块的 iPhone 12 pro max 也是一样打电话。反正至少打电话的功能是一样的。

    你看,我猜的好像还满通顺的把。没准说不定也全都是错的。
    intellectual
        12
    intellectual  
    OP
       2020-12-14 12:16:58 +08:00
    @dxgfalcongbit 我疑惑的又一个点就是,我用 iina,打开了下载的 8 个 g 的迷你蓝光 mkv 。这个 mkv 里面包含压缩后的 7.1 声道的音频,通过 iina 播放出来,最终传到,用蓝牙连接的 airpods pro 立体声耳机里面,不知道音频会损失啥吊样》
    icyalala
        13
    icyalala  
       2020-12-14 12:51:40 +08:00
    空间音频是通过 HRTF 计算出来的空间感,但是不同的人、不同的耳廓 HRTF 是有差别的,
    所以想要更好的 HRTF 就需要更大的计算量和更多的传感器 /麦克风。
    icyalala
        14
    icyalala  
       2020-12-14 12:59:54 +08:00   1
    7.1 声道的音频,你照着相同模式去摆音箱当然能获得好效果,
    但如果你用耳机来听,那就非常依赖 HRTF 算法了。但是在没有耳机传感器的情况下,软件或硬件只能使用一些通用的 HRTF 模型,这样效果在不同人耳体验上就会有差距了。从这点上看苹果的思路至少是更好一些的。
    0A0
        15
    0A0  
       2020-12-14 14:13:18 +08:00   1
    @intellectual 楼上帖的电玩科技 ak 的视频里刚好有几期能解决你的疑问和不明点。
    另外有一点要说的是音质最终呈现出来的好坏不是靠喇叭数量的多少以及这全景声,那环绕声之类的技术。
    单论音质最终呈现的结果的话是水桶效应,取最短的那块板。也就是说在你的声音从解码开始,芯片,协议,线路,设备,线材,干扰,距离,以及试听环境,声学环境等都对音质有逐级的影响,而最终的音质结果取其中最短板的那一环。
    举个比较极端的例子。比如你有最好的无损 wav 档,有超级厉害的前端进行解码输出,用的最好的耳机,但耳机线材是 5 毛一根还送个贴膜的地摊货,那你的音质最终呈现的就是线材能承载的最大值。这样比喻应该方便理解一些吧。

    如果还不太理解的话,就拿这几天正火的赛博 bug2077 做个例子吧。你有顶级的显卡,内存,等 pc 硬件,想全特效+光追体验极致的赛博朋克世界,结果 cpu 是 20 年前的奔腾双核。进游戏发现显卡,内存等占用只有 10%不到,帧数只有电竞 3 帧 ppt 。因为 cpu 已经过载了,它是这个整体里的最短板,以至于没有办法让其他环节充分发挥出全部实力。

    不管是算法,还是芯片,还是硬件设备,在音质这个领域都是协同工作并取最低值作为最终结果的。如果你想要达到某个目的,可以在确定需要的硬件后,让每个硬件的能力都差不多是最佳选择。

    至于 DTS 跟 mp3,可以理解为为了压缩体积而“不得不选择牺牲一些人耳听不到和感知微弱的频率进行删除”来尽可能的保留大部分音频数据的情况下缩小体积。DTS 之所以大又是因为它独特的算法以及包含录制时几乎全部的声音与环境细节所决定的,它只是种无损的编码格式。而最终要怎么播放,参考上面说的短板流程。

    而 wifi 和蓝牙的区别就更直观的,协议的不同导致带宽和延迟等大小不同。带宽越大,相当于水管越大,能“同时传输”的数据量越多,例:“小水管能放 mp3 的话,大水管就能传无损。”延迟越低,就越好(诶嘿)。

    杜比之所以是全景,是因为在录制的时候就已经单独录制好了每个声道的音频,然后打包在一起而已。所以播放设备只要支持杜比认证,就能识别到它的协议并且正确还原出每一个声道的数据给对应的设备播放。至于这个协议是杜比授权的,还是非法授权甚至山寨模拟的,就不好说了。所以你光有芯片没有用,必须要有对应的杜比音源。

    而模拟全景声,就像果子的空间音频了,因为有强大的自研算法,可以通过软硬件结合来最大程度还原出逼真的全景声效果,所以也支持读取杜比全景转成果子全景。目前仅此一家。

    最后的最后,即便你有个包含全景声音频的视频,最终能不能听得到还原出来的全景声,还是得参考上面的短板原理。
    你的播放设备,解码协议,数据传输方式,接收端的支持与否,都决定你最终听到的结果。如果想顺利听到,确保每一个环节都是能支持多声道的传输与接收,最终才能听得到。

    嘴说着让你去看视频,不知觉又敲了半小时键盘,职业病- -。
    intellectual
        16
    intellectual  
    OP
       2020-12-14 15:19:13 +08:00
    @0A0 非常感谢你能说这么多,真的。 我连去找视频都不一定能找到说这些技术的视频,你也知道那些视频推荐算法不一定讲干货的就排名靠前。你说的这些对我是加深理解和扩展,非常有用的。我还真搜了半天,可惜 Mac 无缘了,win 下面一直习惯用罗技,罗技就有一款 G433 颜值不错,价格也比较低。接 pc 和 pcvr 可以 7.1 声道,别的都是立体声。
    耳机这行业都多少年了,还真是有点复杂和缓慢。。。似乎耳机企业可能不涉及太高的高科技吧,等于是只能匠人似的做玩意,一直等不到老大哥开发普惠技术。这苹果来了,奈何技术都是自己私密的。。。
    唯一接近我理想需求的无线+降噪+多声道全景声,我前年就想着弄一个,不过到现在也才只有苹果才开始刚刚起了个头。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     999 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 18:38 PVG 02:38 LAX 10:38 JFK 13:38
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86