top of page

​合成音声バイキング

とは…

昨今増えてきた音声合成を各自で作ることのできるツールやソフト、それらを巡り楽しんでいこう!​​という企画。

​音源制作のログ・身近な雰囲気を上げる側面も狙っています。

好きなように!好きなだけ!

​作りたいものを作ろうというバイキングの名前も頼ります。

MMVC

Vol.1

(RealTime-Many to Many Voice Conversion)

​ショタジジイがいたらいいな

「たらのき」はMMVC用向けに収録された音声群です。
ITAコーパスEmotionとRecitationに加えて独自に作成した20文(計444文)の音声からなっています。

過程@ツイキャス~Youtube

より長文を読んだデモは1-2にあります

MMVCでは自分の声を瞬時に、全く違った声質へ変えることができます。同時学習することで複数の学習モデルを瞬時に切り替えることも可能です。

Copyright (c) 2022 Isle.Tennos  Released under the MIT license  https://opensource.org/licenses/mit-license.php

ewaku.png
おじい型.png

たらのき

キャラクターメモ
人外ショタジジイ。小学生ほどの見た目をしている。
一人称 わし 
二人称 お主 親しいとお前、お前さん
三人称 奴
語尾 のう、じゃぁ、おるう、おけよう等
好物 りんご飴
呪いにかけられて子供の姿になったといわれている。本人は子供になってからも不便と感じることもあったが戻ることを半ばあきらめており、現在に適合しているつもりである。
ewaku.png
のめ型.png

Fn-hinome

キャラクターメモ
タイプ:クリーチャー
顔に影がかかり眼だけがしっかりと見える。
DeepVocal

Vol.2

デフォルトで声質が混じって歌ってほしい

「Fn-hinome」はDeepVocal音源です。
所持していたUTAU用CVVC音声や単独音、連続音音声を流用・音階を混ぜて一音階分に編集しています。

過程@Youtube

husenR.png

まとめ動画もあります

DeepVocalでは直感的な手書きピッチ、トラック操作が可能です。CVVXでの合成が自動的に行われ、発音と発音のタイミング操作も視覚的に行えます。

CoeFont

Vol.3

ノリノリに読み上げてほしい

「さわかばともとよしやのね」は楽しみの感情で収録されたコエフォントです。
ね、な、よの文末で(だね、だよなど)感情の入りきらないようなノリが醸し出しやすいです。

過程@Youtube

収録回と出力確認回
​のみです。

コエフォントではブラウザ上で合成音声の使用・モデルの作成ができます。ユーザーによって作られた多くのコエフォントを利用することもできます。

ewaku.png
さわかば型.png

さわかばともとよしやのね

キャラクターなし
ewaku.png
ゆえつじ型.png

故辻 箒

キャラクターメモ
ゆえつじ ほうき。
白いスーツと白いフリルハット、革靴黒手袋をした女。
一人称 私 
二人称 君 あなた
三人称 彼 彼女 ○○さん
口調 少し砕けながら距離のある
好物 落ち着いた空間での喫茶を
好とする

MYCOEIROINK

Vol.4

ニヤニヤと若干自信ありげに読んでほしい

「故辻箒」はCOEIROINKのモデルです。
ITAコーパスとMANAコーパスを適宜収録し作成しています。
3スタイルを1纏めにして通常・テンション高め、低めと若干の差をつけることができます。

過程@Youtube

husenR.png

学習回すのを結構
​飛ばしています。

COEIROINKでは打ち込んだ文章を読み上げてくれます。直感的なアクセント操作と各種パラメータ、ピッチ描画で変化を付けることができます。

Vol.5

TALQu

怒りにいろいろ混ざっててほしい

「矢野隣」はTALQuのモデルです。
ツッコミのテンションを元に、Haruqaコーパス2.0付属予定ベリーイージーエディションを利用し作成しています。
​スイッチフラグ対応で感情の方向を切り替えられます。

過程@Youtube

アーカイブ編集がされています。

TALQuでは打ち込んだ文章を読み上げてくれます。
​スライダーによる音高や速度操作の他、ピッチラインの描画で幅の広い音の高さ調節ができます。
​モデルごとにフラグ対応の有無やボコーダーモデルの種類など異なる要素も多いです。

ewaku.png
やの型.png

矢野 隣

キャラクターメモ

やのとなり。
黒髪・団子まとめの和装している女。
一人称 アタシ私ボク 不定 
二人称 お前あんたあなた 不定
三人称 あいつあの子 不定
口調 親しみはありながら荒め
好物 人のつくった(やばくない)飯なら大体
ewaku.png
かお型.png

Cカオル

キャラクターメモ
タイプ:エイリアン
ギリギリ異邦人。一つ結びにした黄金色の髪の毛はとても潤っている。赤いグローブとエプロンのようなフリル、タイトスカートを着用。ピンヒールはかなり高い。
趣向:人がおいしそうにものを食べる様子が好き。空腹そうな姿を見つけるととても心配する。食べること自体も好む。

ENUNU

Vol.6

AI歌唱合成の歌唱を聞いてみたい

「Cカオル」はENUNUモデルです。
UTAU原音と童謡・自作曲から作成しています。

 

過程@Youtube

husenR.png

まとめ動画もあります

ENUNUではUTAU上でNNSVSモデルを使用可能です。
プラグイン形式でustのまま歌わせることができます。
​モデル作成のためのtraining kitも配布されています。

bottom of page