原因很简单,现有的音频转 MIDI 的软件,其本质是对音频进行 FFT 然后把相应音高的频率对应到 MIDI 里面,但由于音频中有很多噪音(比如打击乐)转换的效果其实都很差。
大家会发现,转换出来的内容,其实只有单轨,一般是钢琴音色。目前的技术还不能分出各种音色,更不用说打击乐了。
一般这种软件的用法是,对于单一乐器的音轨进行分析,然后还需要到各种软件中进行修改,真的不能直接转换出来的就直接上传。对于复杂乐器,就更不行了。
不过也许未来机器学习相关技术成熟以后,也许能还原出原始的 MIDI,但考虑到现在的一些音乐所用的音色或者插件,已经远远超出了 MIDI 本身的表达范围,这也使得还原变得更加困难