序

本記事では、ナレーションや配信などで、自身の声を収録するにあたって、収録環境を構築するための基本的な知識やアドバイスを提供する。

中心となるのはマイク及び収録機材(オーディオインターフェイス等)の話であり、これに加えて音響室のような設備に関わる話や、音声調整に関わる話もする。

前提として、私は音楽家歴は長く、声優として自身の声を録ることもあるが、サウンドエンジニアリングに関しては、所謂「本職ではない」というやつだ。レコーディング時などにサウンドエンジニアが不在の現場というものもあり、その場合は私が収録技術も担当することはあるが、サウンドエンジニアがいる現場では基本的には絶対に触らない(指示されば助手のように走り回ることはある)。

このため、もし本職のサウンドエンジニアから異なる意見を聞いたのであれば、本職の意見を尊重したほうが良いだろう。

基本的な用語

収録 (レコーディング)

収録はここではマイクを介して「生の音データ」を生成することを意味している。

つまり、配信であっても、声を録るということ自体が「収録」となる。

dialog

翻訳すると「対話」。マイクに向かって喋ることを意味する。

これと異なる概念としては、歌唱や、会議室での全体の声の収録などがある。

近接効果

マイクは近づくほど低音が強調して収録される。

「こもった感じになる」というデメリットでもあるが、離すと低音が減ってスカスカに感じられることもある。

クリッピング(クリップ)

音声は入力可能(表現可能)な最大値が存在し、これを基準音(0dB)と呼ぶ。この0dBを超過することをクリッピングと言う。

そして、デジタル音声におけるクリッピングは盛大なノイズになるため、禁忌だ。いわゆる音割れである。

クリッピングを発生させた場合、後の段階で取り戻すことはできない。

なお、音声編集ソフトにおいては、音声素材を指して(オーディオ)クリップという場合もある。これは全く別の語である。

コンプレッサー

音声入力の「一定以上大きい音を、ある比率で圧縮する」という処理を行うもの。

例えば-16dBから4:1で圧縮すると仮定すると、0dBの音は-12dBになる。

この入力処理で0dB超過が可能な構造になっている(説明は非常に複雑になるので略)場合は、0dBよりも大きい音が入力できるという意味にもなる。

コンプレッサーの処理は「大きすぎる音を、大きい音に留まるように圧縮する」というものであり、言い方を変えると「過剰に大きい音を小さくする」ものである。ただし、音楽制作では「小さくなって空いた分全体を大きくする」という使い方がされるため、どちらかといえば全体では音を大きくする目的で使われる。

ただし、dialogでは「全体的に大きい(聞きやすい)音にしつつ、大きすぎた部分は抑える」という目的で使われる場合が多い。要は、全体的な音量感を統一することで聞きやすくしよう、というわけだ。

コンプレッサーには実際は様々な設定があるが、このような設定をいじるのは音声に結構詳しい人である必要があり、サウンドエンジニアリングを指向しないなら、複雑な設定を必要せずにポンで使えるやつを使うのがオススメ。

リミッター

リミッターも基本的にはコンプレッサーの一種だが、一定以上にならないように急激に抑制する挙動のもの。クリッピングを防ぐために、「これ以上の音量は許さない」という感じで使う。

コンプレッサーでもレシオを極端に高く、アタックを極端に短くすれば代用可能だが、そうすると自然に聴こえないことが多い。

とはいえ、リミッターはコンプレッサーほど自然にはできない。音の向上のためというよりは、クリッピングを防ぐ砦である。

音楽制作で使われる場合は、リミッターによってクリッピングを防ぎつつ最大まで音圧を稼ぐようなものもある。

マイキング

マイクを設置すること。

特に楽器収録の場合は、何本のマイクのどの位置に設置するかという選択の余地があり、設置に技術が必要になってくる。このため、マイク設置というエンジニアリングがあり、それをマイキングと言う。

この設置そのものは「マイクを立てる」と表現する。

dialog収録のような、口元にマイクを立てるだけの場合は基本的にマイキングとは言わない。

マイクと音声入力の仕組みと機材

何が起きているか

マイクから収録に至るまで、

マイク
アンプ
A/D変換
ソフトウェア

という経路を通る。

マイク

マイクは音、つまりは空気の振動を微弱な電気信号に変換する。

この信号はマイクレベルと言い、非常に微弱な信号である。

アンプ

アンプは電気信号を増幅する。この場合、マイクレベルの信号を増幅し、ラインレベルの信号として出力する役割を持つ。

この用途のアンプは一般的に「マイクプリアンプ」と呼ばれる。

A/D変換

A/D変換装置はアナログの電気信号をデジタルデータに変換する。

音楽制作用途(配信を含む)で使われるA/D変換装置は一般的に「オーディオインターフェイス」と呼ばれるものに組み込まれており、それ自体をオーディオインターフェイスと呼ぶケースも多い。場合によってはオーディオインターフェイスではないものに組み込まれている場合もあるが、その場合でも「A/D変換器内蔵」ではなく「オーディオインターフェイス内蔵」と表現することが多い。

(本記事でもそのように表現する場合がある)

ソフトウェア

A/D変換器を介してコンピュータに入力されるものはデジタルデータであり、コンピュータソフトウェア上で取り扱うことができるものである。

なので、デジタル変換された後はコンピュータの中の世界になる。

音声プロセッサ

追加の音声プロセッサを使用する場合、アンプとA/Dの間にある場合と、A/Dの後ろにある場合がある。

前者の場合、電気信号を加工するもので、後者の場合音声データを加工するものである。

独立した機材を使用する場合は前者にするしかないが、比較的安価な機器に内蔵されている場合は後者が多い。

オーディオインターフェイス

「オーディオインターフェイス」という言葉は、「用語としての意味」「製品としての意味」「概念としての意味」のおおまかに3種類の用いられ方がある。

用語としては、アナログオーディオデバイスを接続するためのインターフェイス機器であり、コンピュータから見た場合のオーディオデバイスである。つまり、マイクやスピーカー、ヘッドフォン、MIDIキーボードやシンセサイザーなどを接続するためのデバイスということだ。

コンピュータからみたオーディオデバイスは「サウンドカード」「サウンドボード」という呼び方もあるが、これとの明確な違いは難しい。が、そもそも「サウンドカード」のような呼ばれ方はPCI接続のような内蔵型の基板がつ割れることが一般的だったが、現在はUSB接続やLightning接続(あるいは廃れかかっているが、FireWire接続)が一般的で、「カード」「ボード」感がなく、そのように呼ばれることは少ない。

しかし、現在でもゲーム用やホームシアター用の出力用オーディオデバイスは「サウンドカード」と呼ばれることもある。また、類似の例として、オーディオリスニング用の出力用オーディオデバイスは「DAC」と呼ばれることが多い。

製品としての意味は、一般的に「オーディオインターフェイス」として売られている製品は、A/DおよびD/A変換器に加え、入出力のアンプは最低限備えており、ファンタム電源やミキサー機能もあるのが普通となっている。このため、このような「PCと接続するオールインワンボックス」を指して「オーディオインターフェイス」と呼ぶものである。

そして、もっとふわっとした概念として、「マイクやスピーカー、ヘッドフォンなどとPCの間にあるもの」として「オーディオインターフェイス」が使われることもある。基本的にはPCから見てオーディオデバイスになるものを呼ぶが、中には3.5mmプラグで接続するオーディオボックスをオーディオインターフェイスと呼んでいるケースもある。

機材構成

ここまでの説明でPCに入る前に機材が3つあることが分かったが、製品として3つに分かれているとは限らない。

一般的にオーディオインターフェイスはマイクプリアンプとA/D変換器の両方を持っている。 USBマイクロフォンなら、この3つの機材がすべて1つに収まっている。

マイク選択

原則

一番大事なのはマイクは「良い悪いは存在するが、それよりも合う合わないのほうが大事」ということだ。

この場合の「合う合わない」とは、音声ソース(声とか)と表現意図である。

「良い悪い」があるケースとしては、例えば私が子供の頃に買ったAudio-Technica VD3という安価なスピーチマイク¹は、とにかくノイズが乗る。少しケーブルが揺れただけでも壮大なノイズになり、声を載せようとしてもノイズがすごく大きくなるため、扱いが困難である。こういうマイクは「悪い」と言って良い。

あまりに悪いマイクは収録にとても苦労するが、そうした問題がない前提であれば、音の良い悪いよりも、合っているかどうかのほうがずっと大きい問題なのだ。

例えば、低音が強すぎて音がこもって聴こえるマイクがあったとする。一般的に原音の再現性が低いマイクは「悪いマイク」とされるが、これは実際に全ての人に悪いマイクだとは限らない。例えば男性で、深みのある声を出したいが、声質は低音成分が少なく薄く聴こえるという悩みを持っている人がいたとする。このような人には、低音が強調されるマイクは素晴らしいマイクとなるかもしれない。

同じようなことでは、女声の伸びやかな高音を美しく取れる「良いマイク」は、迫力ある低音を響かせたい男声には「平凡なマイク」であるかもしれない。

初めて「マイクを選ぶ」という行為に触れる人に私が言っているのは、「自分に合ったマイクを探せ」「評判が悪くても自分の魅力を引き出せるなら、それがあなたにとっての最高のマイクだ」ということだ。

他の判断軸として、「信頼」というものもある。これは、「このマイクであれば一定以上のクオリティで録れるはず」という信頼を優先する方法で、そのような信頼ができる特定のマイクを使用する。また、収録するのがレコーディングエンジニアではなくミキシングエンジニアだったりする²場合は、「音の素性を判断する(後のミキシング工程のために)のに、一定の収録条件のほうがいい」という理由がある場合もある。

ノイマンのマイクを愛用するエンジニアは、ノイマン教³である場合もあるが、単にノイマンに信頼を置いているだけというケースもある。

フィッティング

長期に渡って組んでやる場合は、その人の声に合わせた「フィッティング」という作業を行うことがある。

通常の収録では、エンジニアは収録環境を確認して、その環境に合わせてマイキングを行う。プレイヤーは基本的にマイキングされた部屋に入って収録を行う。

フィッティングは、その人に合わせてマイク、ケーブル、マイキングなどを試し、最適なものを探るものである。手間がかかるため本当に本格的に組んでやるのでなければ実施しないが、効果は非常に大きい。

稀に、プレイヤーが入ったあと試し録りをし、その結果を元にいくつかの候補を試すクイックフィッティングを行う場合もある。これをミキシングエンジニアが行うことはほとんどなく、どちらかといえばマイクマニア気味のレコーディングエンジニアが行うことが多い。

ダイナミック vs コンデンサー

ダイナミックマイクは空気振動で振動板が震え、これにより発電されて電気信号になる仕組みのマイク。構造自体はスピーカーと同じ。

コンデンサーマイクは空気振動によって電極間の静電容量の変化を電気信号に変換する仕組みのマイク。電極には電気が通っていないといけないため、電源が必要になる。

一般的に「ダイナミックマイクよりコンデンサーマイクが良い」などと言われたりするが、そんなことはない。一長一短であり、適材適所だ。

ダイナミックマイクの良い点は

扱いが楽で柔軟
ノイズが乗りにくい
距離によって音が大きく変わる
ピンポイントに音が録れる

一方、コンデンサーマイクの良い点は

微細な音も収録できる
ノイズを含めた空気感のある収録ができる
設置に自由度がやや高い

迫力のある音を録りたいならダイナミックマイクが、繊細な音を録りたいならコンデンサーマイクが適している。特に男声で低音を強調していきたい場合は、ダイナミックマイクで近接効果を狙っていったほうが良い。

エレクトレット vs DCバイアスラージダイアフラム

エレクトレットコンデンサーマイクも、DCバイアスコンデンサーマイクもコンデンサーマイクであり、基本的な仕組みは同じ。ただし、構造が違う。

エレクトレット素子を利用したエレクトレットコンデンサーマイクは、DCバイアスコンデンサーマイクと比べ電荷を保つために必要な電気が少ない。

世の中には「エレクトレットコンデンサーマイクは安物、DCバイアスのほうが本格的」みたいな言説があったりするが、別にそんなことはない。どちらかといえば「エレクトレットコンデンサーマイクのほうが進化していて現代的」というほうが正しい。

とはいえ、音への影響も確かにある。 DCバイアスのほうがかなり繊細に音を捉えるので、より微細な音でも拾えるし、解像度が高い音にもなりやすい。このことから言えば、エレクトレットコンデンサーマイクはダイナミックマイクとDCバイアスコンデンサーマイクの中間のような特性になりやすい。

が、これは良し悪しであるとは限らない。DCバイアスコンデンサーマイクの場合、「拾いすぎ」ということが普通にあるから、エレクトレットコンデンサーマイクのほうがちょうどいいケースもある。

また、これとは別にダイアフラムのサイズという問題もある。ダイアフラムのサイズは大きいほうがパンチがありふくよかな音になる。小さいほうが高音が強調された音になる。そして、概してエレクトレットコンデンサーマイクのダイアフラムは小さい。

実際のところこれはエレクトレットコンデンサーマイクかどうかという問題とは別問題ではある。しかし、ダイアフラムが大きいほうが深みがあるため、「いい音」に聴こえやすいという側面がある。もっとも、高くて可愛らしい声を録りたいのなら、エレクトレットコンデンサーマイクのほうが良いケースも多い。ダイアフラムが大きいと物理的な大きさ(抵抗)・重さのため動きが鈍くなる。「高い音=早い振動」である以上、動きが鈍いと高い音は苦手になってしまう。といっても、声程度の高いならどうということはないのだが、高音成分を活かしたいときはエレクトレットコンデンサーマイクも普通に考えられる。

配信用のコンデンサーマイクやUSBコンデンサーマイクはエレクトレットコンデンサーマイクが多い。あと、Audio-Technicaのコンデンサーマイクは上位モデルまでエレクトレットコンデンサーマイクが多い。

エレクトレットコンデンサーマイクは小型化も得意なので、ボイスレコーダーや、ヘッドセットなんかにも使われることが多い。このため、ヘッドセットのマイクが油断ならない良い音で録れるというケースもまあまあある。

エレクトレットコンデンサーマイクは軽くて、小型で、扱いやすい。 DCバイアスコンデンサーマイクの場合、衝撃や振動や湿度変化や温度変化に弱く、防湿庫で保管し、細心の注意を払って運搬する必要があると言われていたりする。それと比べれば、設置しっぱなしでも問題ないエレクトレットコンデンサーマイクは大変に良い。とても魅力的な存在だ。

だが、規格上の互換性や、ラージダイアフラムのサウンド的な魅力などを考えるとDCバイアスコンデンサーマイクを選びたいこともある。これは、エレメントの構造に由来するものではなく、それぞれが「どのような商品に採用されているか」の違いに由来するところではあるのだが。

結局のところ、手間暇かけるような収録であればDCバイアスラージダイアフラムコンデンサーマイクのメリットが魅力的だが、配信だとエレクトレットコンデンサーマイクのほうが魅力的。

余談だが、両者の電源に関する知識もあると良い。

エレクトレットコンデンサーマイクは必要な電気が少ないとはいえ、電気がないと動かない。ところが、エレクトレットコンデンサーマイク、あるいはFETコンデンサーマイクは3.5mmプラグになっていて、電源につながるところがないように見えることがある。「コンデンサーマイクにはファンタム電源が必要」という一般的な説明に反することだ。

これは2つのポイントがある。まず、エレクトレットは電荷を閉じ込めておける素子であるということだ。このため、「電荷の缶詰」なんて言われたりする。

この仕組み上、製造段階で電荷を閉じ込めておけば、電源供給が必要ない。

さて、一部のエレクトレットコンデンサーマイク、およびFET(接合型電界効果トランジスタ)エレクトレットコンデンサーマイクは電源供給が必要である。

FETエレクトレットコンデンサーマイクという新要素が出てきたが、これはエレクトレットコンデンサーエレメントからFETを使ったインピーダンス変換器につながっているものである。つまり、音を拾う部分には電気を与える必要はないが、音を出力する部分には電気が必要になっている。

このようなケースのために、プラグインパワーという仕組みがあり、3.5mmジャックからDC5Vの電気を供給する。 (といいつつ、低いものでは1.5Vくらいらしい。)

WindowsのPCだと大抵の場合はプラグインパワーに対応しているが、スマートフォンだとプラグインパワーを提供しない機種があったりする。このため、機種によって3.5mmでマイクにつないでも音が入らない、ということがある、らしい。

DCバイアスコンデンサーマイクに電気を供給するファンタム電源は、バランスオーディオ信号と同じ線の上にDC12〜52Vを載せる。一般的には48V。結構高い電圧であり、取り扱いに注意が必要なレベル。

といっても、実際のところ最近のDCバイアスコンデンサーマイクは48Vも必要ないということも多く、このような場合は減圧するようになっている。そして、これでFETコンデンサーマイクも動く。

この説明は難しいが、つまりどういうことかというと、「3.5mm接続になっているコンデンサーマイクを、ファンタム電源を持つオーディオインターフェイスにXLRで接続して、ファンタム電源をオンにして使うことは、大抵の場合可能」ということだ。

もうひとつ、コンデンサーマイクの「繊細さ」について。

前述のように、コンデンサーマイクは「取り扱いに細心の注意が必要な繊細な製品」だと言われているが、私はそうは思わない。というのも、私の音楽人生の中で、そこそこコンデンサーマイクを落としたり踏んだり、猛暑の真夏に冷房がキンキンにかけられたスタジオに持ち込んだりということをしたことがあるが、そういうのでコンデンサーマイクが壊れたことは一度もない。最近のコンデンサーマイクは結構丈夫だ。

リボンマイクに関しては、一発で壊した人を知っているので壊れると思うが、まぁそれは特殊な話だろう。コンデンサーマイクでそこまで神経質になる必要は、多分ない。私が防湿庫を買ったのも、リボンマイクが欲しかったからだし。

ここらへんの話はSHUREの記事がかなり興味深かったので参考になるかもしれない。

コンデンサーマイクのマウント

コンデンサーマイクは一般的にショックマウント、あるいはサスペンションマウントと呼ばれるもので固定する。これは、固定された枠にゴム線を介してマイクを固定する部分をつないでいるもので、ゴムで揺れることで衝撃がマイクに伝わらないようにしている。

これはコンデンサーマイクが壊れないよう、衝撃吸収するという面もあるが、そもそもマイクにおいて「振動は音になる」ものであり、コンデンサーマイクは感度が高いのでちょっとした振動がすごくノイズになるという問題への対策だ。

コンデンサーマイクの製品自体に固定型のアダプタが付属していたりするが、実際のところショックマウントは絶対必要。ないと安心して使えない。特にPCのキーボード操作をするようなケースでは、ものすごいノイズになる。

ショックマウントへのマイクの取り付け方は、エレクトレットコンデンサーマイクの場合はマイクのボディで固定、DCバイアスコンデンサーマイクの場合はマイクのコネクタのところにネジ固定が多い。が、マイクのメーカーごとにこの規格が違う。おのれ。

可能ならスパイダーショックマウントというものが良い。私はAmazonで買った怪しげな製品を超愛用してる。なんといっても多彩なアダプターでマイクのメーカーごとにマウントを用意しなくて良いのが素晴らしい。

USBマイクロフォンはマウントに取り付けられる形状になっていないことが多い。が、ノイズキャンセルの回路を持っているのか、意外と気にならない製品もある。

ちょっと厄介なのはSE Electronics製のコンデンサーマイク。だいぶ変わった形をしていて、専用品しか使えない。そして専用品がめっちゃ高い。

マイクの抜き差し

ファンタム電源を通電したままコネクタを抜き差ししてはいけない。

これは、マイクとインターフェイスどころか、接続されているすべての機器にダメージが入る場合がある。

アンプの電源が入った状態でやるのも、ファンタム電源で通電しているときほどではないが危険なので、コネクタの抜き差しはファンタム電源をオフにし、ゲインを0にして行うことを徹底すること。

マイク vs マイクスタンド

マイクはマイクスタンドのネジの規格も知っておいたほうが良い。

マイクスタンドはほとんどの場合、3/8インチの「AKG規格」と、5/8インチの「SHURE規格」が占めている。 AKG規格をSHURE規格に変換するアダプタネジを介してどっちでも使えるようにしているスタンドが多いが、変換ネジを使ってこれらは相互に変換可能。「変換ネジが必要な場合がある」ということだけ頭に入れておけば良い。

が、規格自体は他にもある。

まず、JISだ。これは5/16インチサイズ。 ONISHI製のマイクスタンドがJIS規格になっている。変換ネジの製品が少なく入手性が悪いので、JIS規格のマイクスタンドはかなりつらい。

そして、カメラ三脚などで一般的なのが1/4インチのカメラ規格。カメラスタンドと組み合わせる場合なんかに関わってくるけど、音響機材でもボイスレコーダーなんかはカメラ規格だったりする。これも変換ネジでなんとかなるけど、製品は少ない。

このほかに1/2インチの規格も2種類あるが、こちらは触れることはほとんどない。

マイクケーブル

マイクケーブルはマイクとマイクプリアンプをつなぐためのケーブル。

マイクから出る信号はマイクレベルの信号、つまり微弱な信号であるため、ノイズに非常に弱い。このため、ノイズが混入しづらいよう、シールド線が使われる。ちなみに、4芯である。

マイクケーブルと呼ぶ場合、単純にXLR-XLRのケーブルを指す場合もあるが、これは「接続できる」というだけで混乱を招く話である。というのも、ちゃんとしたオーディオ用のマイクケーブルだと、ケーブルとコネクターは別の製品でだからだ。といっても、購入するときはくっついたものを買うのが普通。

なお、この流れだと「マイクケーブルとラインケーブルは別物」という話になりそうだが、特にそんなことはなく、ケーブル自体はマイクケーブルもラインケーブルも同じものがほとんど。ただ、Amazonで買えるようなシールドが甘いケーブルは、ラインケーブルとしては使えても、マイクケーブルとしては厳しいということはある。

マイクケーブルはアナログオーディオ機器であり、品質が音に対して与える影響が大きいデバイスである。割とシビアなので、適当なものを選ぶのはおすすめし難い。マイクケーブルの基本は「信頼できる間違いのないメーカーの製品を選ぶ」である。

その中でも特に有名で鉄板なのが、CANARE(カナレ)とBELDEN(ベルデン)。

カナレは名古屋市で創業した日本の音響設備メーカー。カナレが売っているXLRケーブルは、ケーブルにカナレ製のものを使い、ノイトリック製コネクタとITT製コネクタの2種類。特にノイトリック製のコネクタを使っている製品が人気。

ベルデンはシカゴで創業されたアメリカのメーカー。ベルデンが売っているXLRケーブルは、コネクタにノイトリック製のものを使っている。コネクタ自体は同じだけど、ケーブルは8412と1192Aの2種類がある。 8412はオーディオケーブルを自分で組むときに使うケーブルとしてこの上ないほどの定番製品。1192Aはもうちょっと安いケーブルだけど、XLRケーブルとして買うと別に安くなかったりする。

それ以外だと、サウンドハウスで売られているClassic Proのケーブルが安いけど品質はそこそこ良い。

私は一部ベルデンを使っているけど、基本的にはカナレ。ライブなどではほとんどの場合カナレが使われる。主な理由は信頼される製品で、比較的安価で、入手性が非常によく、バリエーションが豊富なため。

バリエーションは長さのバリエーションに加えてケーブル色がある。目的の違うケーブル(長さやコネクタが違うなど)が混ざってしまって設営に苦労する場合があるため、色分けできるのは便利なのだ。

なお、マイクケーブルは多少品質に差があっても短いのが正義。だるんだるんになるような長いケーブルは避けたほうが良い。

(こうして家にケーブルが増えていく)

XLR vs TRS

XLR(キャノン)は3本のピンが生えているタイプのコネクター。 TRS(フォン)は1本の棒に2本の絶縁体が巻かれているタイプのコネクター。

基本的にマイク側はXLRオスになっていて、ケーブルはXLRメス端子である必要がある。しかし、オーディオインターフェイス側はXLRオスでもTRSオスでもどっちでも挿さるようになっていることが多い。

これは、本当にどっちでも良い。マイクケーブルはXLRが普通だけど、これは慣習に過ぎない。

「どっちのほうが汎用性が高い」とかいう話をしたいところだけど、現実問題機材次第でXLR-XLRもTRS-TRSもXLR-TRSも必要になるから、なんとも言えない。まぁ、マイクだけの話をするのであれば、XLR-XLRでいいと思う。もし欲しいケーブルがXLR-XLRが高い(あるいは、欲しい長さがない)、XLR-TRSならあるとかであれば、XLR-TRSでも問題はない。

USBマイクロフォン

私は、要件がそれで満たせるなら、USBマイクを使うのが絶対に良いと言い続けている。

まず、マイクロフォンの場合は最初のほうで述べたように、マイク自体に加え、ケーブル、プリアンプ、A/D変換器の3つが必要になってくる。そして、それぞれ「何が良い」という選択が必要になり、マイクを決めたとしても、「このマイクで狙った音を作るなら、ケーブルはコレで、プリアンプはコレで……」みたいなのがある。

ものすごくお金と手間がかかる。

ところが、USBマイクロフォンなら、マイクという製品にマイク、プリアンプ、A/D変換器が全部入っている。そもそもマイクの外にアナログ電気信号を出す必要がないため、マイクケーブルに相当するものは存在すらしていない。

これは、単に手間がないというだけではない。比較的高価な、良い製品であれば、マイクに合わせたプリアンプやA/D変換器を開発することが可能なのだ。マイクのせいでプリアンプやオーディオインターフェイスを悩むのは、マイクに対するフィッティングの問題なので、最初から最適なものがくっついていればそれ以上良いことはない。

もちろん、別体になっていればより高品質なプリアンプやA/D変換器を選択できるじゃないか、という主張もあるのだが、めちゃくちゃお金を投じる意思があるのでない限り、最適化された組み合わせを超えることはない。

加えてアナログ線が外に出ておらず、マイクとPCをつなぐのはデジタル信号が通るUSBケーブル。ノイズにも強い。

USBマイクを超える結果は、そうそう出せない。

似たような話として、パワードスピーカーとパッシヴスピーカーの話があったりする。パッシヴスピーカーのほうが良いとされているが、実際のところパワードスピーカーよりも良いアンプの組み合わせを導き出すのは困難。それと同じようなことなのだ。

USBマイクの場合、ミュートスイッチなど欲しい機能がマイクに統合されているのも魅力。そうでないと、ミュートスイッチが欲しいなら配信向けのミキサーを使わないといけないということがあったりする。 USBマイクは「実はリミッター/コンプが内蔵されています」なんて製品も多いのも魅力。

ではUSBマイクが適さないという判断はどこにあるのか。

まず、オーディオインターフェイスのインターフェイスが必要な場合。例えば弾き語りを収録するためにマイクとラインの音を混ぜたいとか、XLR接続が必要なスピーカーを接続したいとか、そういうとき。別に併用したっていいし、LinuxならUSBマイクとオーディオインターフェイスの両方から音を録ってもいいが、WindowsのDAWだと大抵単一インターフェイスからしか収録できないので、うまく要望を満たせないことがある。

次に、モニター環境にこだわりたい場合。最近のUSBマイクはダイレクトモニター機能がある製品が多く、自分が喋っている声をマイクにイヤフォンをつなぐことで確認できる。このようなUSBマイクはオーディオ出力を持つデバイスになっていることが多く、そこにPCから出る音を混ぜて聴くことも可能だ。

しかし、このようなUSBマイクは出力ゲインが独立したノブになっていないことが多く、「もうちょっと大きい音で聴きたい」という要望が効かない。また、そもそも出力音の品質に満足しないというケースもあるだろう。

そして、「欲しいマイクがない」場合。

USBマイクロフォンは製品が割と限られ、しかも一般的なマイクと異なる規格で作られていることが多い。結果、一般的なマイク機材(マイクスタンドとか)と組み合わせられなかったり、そもそもマイク自体が希望しているもののUSB版がなかったり……ということがある。

これらは、マイクの音質以外の面に大いにこだわる場合、USBマイクロフォンでは満足できない可能性があることを示している。しかし、USBマイクロフォンで満足できるなら、USBが良い。

マイク以外の機材に関するアドバイス

独立プリアンプはやめておけ

通常、マイクプリアンプはオーディオインターフェイスに内蔵されたものを使用するが、単独機材としてのマイクプリアンプというものも存在する。

そして間違いなく言えるのは、超高級なものを使うのでない限り、そのような機材は使うべきでないということだ。

まず、マイクプリアンプを独立にすると取り回しが悪くなる。スタジオ備え付けにするなら問題は小さいが、それでも扱いは結構面倒だ。

そして、ほとんどの場合良い結果にならない。超高級プリアンプはそれはそれは良いものではあるが、そもそも最近のオーディオインターフェイスはかなり良いマイクプリアンプを持っているケースが多い。だから、スタンダードな価格帯(2〜3万円くらい)のオーディオインターフェイスを使えばかなり満足度の高いマイクプリアンプが使えるケースも多いし、それで満足できない場合でももう1ランク上(6〜10万円くらい)のオーディオインターフェイスを購入するほうが良い結果になる。

音響調整 (調音)

音を収録するとき、「音がどう響くか」は非常に重要な要素である。

配信ではなく収録後に処理を加える前提であれば、収録はドライ(反響がない)のほうが好ましい。ただ、収録で反響を含めたい場合もあるので、このような場合はレコーディングルームで調整される。

反響の抑制は室内の形状と重量に大きく左右される。物が多い室内で収録する場合、反響が気になることはあまりない。

だが、防音室だとそれなりに反響するので、調音パネルを導入したりする必要がある。

また、ミニマリストで部屋に物が全然ない場合は、吸音パネルを貼るなどして反響を抑制する必要がある。

過剰な反響はかなり悪い体験になるので注意したい。

防音室

防音室はコンパートメント型の場合、ヤマハの「アヴィテックス・セフィーネ」とカワイの「ナサール」が有名。私はナサールのユーザー。

両者の違いは少ないので好みの問題だけど、セフィーネはSFっぽい感じで、ナサールは普通に部屋っぽい。あと、ナサールのほうが細かいサイズ違いがあるし、仕様も色々ある。Dr-55仕様もある。

コンパートメント型(定型タイプ)防音室に関しては注意点が多い。

まず重量家具なので、重量物の設置が許される家であるかどうか問題。これが結構厳しい。

次に、中はとんでもなく暑くなる。ゲーミングPCなんて置いたら凄まじいことになると思う。冷房設置は絶対に必要。

そして、ケーブルを通す問題。ケーブルを通す必要がある場合は導線口が必要になる。ナサールの場合は要相談。セフィーネの場合は、カスタムベースモデルを使う場合は導線口が最初からある。通常セフィーネの場合は要相談。ナサールも通常セフィーネも、有償にはなるけど穴あけはやってもらえる。 PCの場合はアースつきのコンセントを必要とするため、その意味でもケーブルを外に出す必要がある。当然ながら、穴を空けると防音性は下がる。

セフィーネもナサールもかなり高価だけど、「素直にコレにしておけ」と言うしかない。

それ以外に関して少し言及しよう。

OTODASUは、中にいる時は静かな感じがするが、中で大きな音を出すと普通に聴こえる。配信に外音が乗ってしまう問題は軽減できるけれど、集合住宅での音漏れ対策には微妙。ミーティングには十分だと思うけれど、配信では不安だと感じた。気密性の高い住宅なら十分かもしれない。

だんぼっちも同じような感じ。

VERY-Qはもうちょっと良い。ただ、OTODASUやだんぼっち同様、低音の遮音性がそんなに高くないのでソースによっては厳しい。吸音性がとても良いのは魅力。

どれくらいの遮音性が必要かは、サウンドレベルメーターが簡単に手に入るので、それで計測してみると良いだろう。私はDr-30のナサールを使っているが、電子ドラムでは部屋トータルで見たときにはあまり気にならない(聴こえないではない)程度の音にはなる。ただし、階下には打撃音が響くため、夜間は使えない。声収録は130dBくらいはあるため、日中でもだいぶ聴こえていると思う。昼間であれば許される、程度だろうか。

ソフトウェア

録音する場合はクリップの扱いが焦点になる。録音時に一部分を録り直したりするが、このときにタイムラインに沿って録り直した場合に、各テイクを「クリップ」として扱うことができる。

dialogの場合はタイムラインの重要性が低く、むしろそのまま流して録って切り貼りしたほうが楽だったりするが、台本朗読だったりする場合はリテイクを楽にするためにDAWや音声エディタを使う価値はある。

もし整音作業をする人が別にいるのであれば、その人の指定に合わせる。

特にない場合はオーディオに強いDAWを使うのが良いだろう。例えばPro Tools, Cubase, Cakewalk by Bandlab., Studio One, Tracktion Waveformなど。これらには無料版が存在し、始めやすい。

だが、DAWは取り扱いの習熟も非常に難しい。さらに別の選択肢としてAudacityがある。

Audacityはオープンソースかつクロスプラットフォームの音声エディタであり、分かりやすいインターフェイスでありながら、実はかなりの高機能。音声を扱う人ならだいたい経験のあるソフトウェアで、オープンソースかつクロスプラットフォームであるため、受け渡しする必要があるときも相手側でいい感じに取り扱うのが楽。

配信ではほとんどの場合、OBS Studio一択。定番であるのはもちろん、非常に多機能で様々なソフトウェアやプラグインとの組み合わせが可能で、非常に強力なオーディオミキサー、ビデオミキサーを持っている。本格的である分難しいソフトウェアではあるが、よく使うようなものは検索すれば答が出てくるため、なんとかなる場合が多いだろう。

収録に関するアドバイス

収録に妥協するな

通常のdialog音声の収録では「整音」と呼ばれる作業をする。これは、ノイズを減らし、聞こえやすい音に加工する作業で、音楽では「ヴォーカルミックス」と呼ばれる作業に近い。

収録は適当でも整音でなんとかなる、はある程度真実である。が、この考え方はやめておいたほうがいい。

なぜならば、収録で苦労するのと比べて、適当な収録を行った音声の整音で苦労するのは、何倍、あるいは何十倍も労力がかかるからだ。

整音を楽にするために、苦労はできるだけ収録でやったほうがいい。

簡単で安定した配信向け収録方法

「コンデンサーマイクを遠めの位置に設置して、大きい声で話す」がすごく楽。

遠めに設置すればノイズは乗りにくいし、大きい声で話すとノイズとのレベル差が大きくなる。声の大きさでスパイクが立ちにくくもなるし、ありとあらゆる面で「調整が楽で安定している」という結果が得られる。

難点は、声を常にちゃんと張るようにするのはそれなりに大変なこと、「遠い感じ」はどうしても出てしまうこと。

なお、マイクの設置は結構悩むと思うが、コンデンサーマイクの場合は基本的に「口の正面にダイアフラムが向いていれば何でも良い」である。マイク自体の向きもどうでも良い。

画面とマイクの位置関係は、とてもむずかしいと私は思う。

ASMR収録に関する重要な助言

ホワイトノイズを収録しろ

ASMRボイスはシグナルレベルが低く、相対的にホワイトノイズが大きい。

ホワイトノイズ消しはやりすぎると音がとても不自然になる⁴ため、消すのには限度がある。そして、人の耳で自然に聴いているホワイトノイズが「突然消える」というのは、集中できなくなるくらい違和感が強い。

これは、間を調整するためにクリップに隙間を空けることで発生する。このようなことは「やってはいけないこと」に属する。

ならどうすればいいかというと、収録環境でパディング用の尺で無音収録するのである。可能であればキャストにいてもらったほうが良いが、いなくても問題ない。

そして、間の調整でクリップが空いてしまう場合、パディング用のホワイトノイズにクロスフェードする。

これだけで、一気に気にならなくなる。

配信では何が変わるのか

dialog音声の完パケと配信で何が違うかというと、「ノンリニア整音ができない」ということだ。

ノンリニアとは音声のタイムラインに同期していないということ。切り貼りのような編集もそうだが、エフェクトの試行錯誤もできない。

配信にミキシングエンジニア(この場合は「PA」と呼ばれる人)がいる場合は良いのだが、そうでない場合は整音のパラメータ調整もリアルタイムにできないことが多い。こうなると、「挿せるプラグインは決め打ち」となる。

dialog音声のノイズ消しは、ゲートを使うのが一番確実かつ簡単だ。実際、私の音声も基本的にゲートを噛ませている。

だが、ゲートでのデノイズは、ソースにおいてノイズレベルがどれくらいかという観察が必要になり、配信で使おうとすると「勘でやるしかない」という問題が発生する。声の調子でも結構変わるし、アンプのゲインによって全然違ってしまうため、かなり難しい。

このような場合に最近活躍するのが、「AIで動的に音声処理をやってくれるソフトウェア」である。 iZotope RXはもはや必需品と言っても良い。私はLinuxでの配信が多いが、Linuxで配信するときはRXが使えないのが本当につらい。

そのほか、入力が大きすぎてクリップしてしまう場合、普通の収録なら「ゲイン下げて録り直そう」となるだけだ。ところが、配信だとクリップしたらそのまま配信に載ってしまう。

配信の場合クリッピングの原因は大抵はA/D時点で既に発生しているため、ソフトウェア処理で解決できない。ここで活躍するのが、リミッターやコンプレッサーを内蔵したオーディオインターフェイスである。

これは別の要因もある。配信の場合は声の大きさを一定に揃えにくい。小さい声が載らないという状態は避けたいため、どうしてもゲインは大きめに設定する。そうなると、大きな声が出てしまうと簡単にクリップしてしまうのだ。視聴者の聴取感を向上させるという意味でも、コンプがあるととても良い。

配信で有効なソフトウェアの話

RX Standardを買いなさい。

配信やナレーションにおいてなんとかしたい要素としては主に

環境騒音
歯擦音
リップノイズ

である。

ぶっちゃけ、どれもとてもつらい。どれもつらいけど、恥ずかしさマックスなのはリップノイズ。 RXはリップノイズまで潰せるのが素晴らしい。というより、ないと生きていけないレベル。

リップノイズ以外は他にも消す方法は割とあって、専用品がなくても割となんとかなるし⁵、ディエッサー⁶は他にも色々出ているから何かのバンドルで持っていたりすることもあるものだけど、リップノイズはどうすることもできないことが多いので、RXが必要になる。

iZotopeにはRX StandardとNectar Plusをセットにした「ナレーター/VTuber 完パケバンドル」というのがある。あればだいたい救われる。

iZotopeの場合、ちょいちょい大幅なセールをやっている。特にバージョンアップ前はすごく安くなる。それと、時々Elements製品の無料配布をやっていたりする。常時無料配布製品はクロスグレードの対象外だけど、不定期に無料になっているやつは対象なので、セール+クロスグレードだととても安い。

Wavesにはぴったしハマる製品がないのだけど、Clarity Vxはあると嬉しい。絶対嬉しい。割と重くて遅延が気になる類のものではあるけれども…… (配信だと遅延の少ないNS1がいいという人もいるらしい)

Wavesも最近OBSに対応したので、配信に使えるようになったので嬉しい人も多いかも。

学校の体育館で使うようなマイクである。↩︎
「ミキシングエンジニア」は収録の後工程である「ミキシング」を専門とする音声エンジニア。レコーディングエンジニアという言葉はもっと広い言葉なので、ミキシングエンジニアもレコーディングエンジニアなのだが、肩書として「ミキシングエンジニア」という肩書の人がいるにも関わらず「レコーディングエンジニア」という肩書の人も配されている場合、「レコーディングエンジニア」は収録を専門に行う人である人が多い。収録を専門に行う人は音響学の高度な知識を持つ人である場合が多く、収録のクオリティを上げてミキシングエンジニアの負担を減らすと共に、さらなる完成クオリティ向上を狙う。↩︎
ノイマン(NAUMANN)は、超高級マイクロフォンのメーカー。「ノイマンだけが唯一絶対素晴らしいマイクだ」と信じて疑わない人も多く、このような信仰を「ノイマン教」と呼ぶ。広義に見ればバイノーラルマイクの「KU100」だけが素晴らしいと信じて疑わないのもノイマン教だが、KU100の場合はそれを売り文句にすることで実際売れるという商業的メリットが大きいため、真の信者ではないかもしれない。ちなみに、私はノイマンのマイクはそんなに好きではない。良いマイクだとは思うが、そのメリットに対して高すぎる。↩︎
ホワイトノイズ消しに限らず、ノイズ消しが強すぎる音は不自然で、実際それで聴くに堪えない音声作品を聴いたこともある。↩︎
実際、私は歯擦音を消すのにRXとは別のゲートを使っている↩︎
歯擦音を消すやつ↩︎

序

基本的な用語

収録 (レコーディング)

dialog

近接効果

クリッピング(クリップ)

コンプレッサー

リミッター

マイキング

マイクと音声入力の仕組みと機材

何が起きているか

マイク

アンプ

A/D変換

ソフトウェア

音声プロセッサ

オーディオインターフェイス

機材構成

マイク選択

原則

フィッティング

ダイナミック vs コンデンサー

エレクトレット vs DCバイアス ラージダイアフラム

コンデンサーマイクのマウント

マイクの抜き差し

マイク vs マイクスタンド

マイクケーブル

XLR vs TRS

USBマイクロフォン

マイク以外の機材に関するアドバイス

独立プリアンプはやめておけ

音響調整 (調音)

防音室

ソフトウェア

収録に関するアドバイス

収録に妥協するな

簡単で安定した配信向け収録方法

ASMR収録に関する重要な助言

ホワイトノイズを収録しろ

配信では何が変わるのか

配信で有効なソフトウェアの話

エレクトレット vs DCバイアスラージダイアフラム