合肥話と北京語/普通話の音韻比較
動機
フォロワーに合肥話ができるかたがいらして,前にキャスをなさっており,影響を受けやすいのでやりたいなーになり,それから一年強が経過していました。えっと一年強なにもしていなかったわけではなくて普通話をちょっとだけやっていました,官話同士だしね。とはいえ合肥話って広東話とかと比べてメジャーじゃないし,なんか一応《享受合肥方言》っていう教材があるらしくて中央大学図書館に所蔵されてるらしいんですけど,ぼくは中央大学の学生ではないので使えなくて,ともかくなるべく自力でやんないといけないらしいです。さて,言語をやるには文法と単語をやる必要があると思うんですけど,正直どっちも教材がないのでできませんっていう感じです。困りましたね。方言の単語を調べようと思って検索すると卑罵語ばっかりでてきて,べつにぼくは合肥話でひとを罵倒したいわけではないのでちょっと違うなあになります。というわけでですね,なるべく自分でインターネットの情報からできそうなことを探してみようっていうことで,普通話と合肥話の漢字音の音韻対応を探してみることにしました。
手法
漢典っていう漢字字典のサイトに,字によっては方言の発音が載っていて,それをがんばって読み込んでいこうと思います。まずサンプルとしていくつかの漢字を選ばなければならないわけですが,そこで取り敢えず常用2500字で調べてみることにしました。常用2500字は,次の文字になります。
画数順に載っております,北京冬運の開幕式と同じですね。ちょっと字数が多くて手作業で発音を調べるのは面倒くさいので,機械にやってもらうことにしました。スクレイピングはサイトに負荷をかけるので良識をもって行いましょうね。うーん,良識がどのぐらいなのかわかんない……でも2500くらいならたぶん機械的には大したことないと思うのでいいかなってなりました。スクレイピングは本当はちゃんとした言語で書くといいと思うんですが,ぼくは技術があんまりないので手っ取り早くWindowsのシェルにやってもらおうと思います。恥ずかしいんですけど一応コードを載せておきますね(出先で自分で見て使いまわしたいかもしれないので)。
$hanzi = (ここに常用字のリスト)
Start-Transcript
for($j = 0; $j -lt $hanzi.length; $j++) {
try {
$tar = $hanzi[$j]
$url = "https://www.zdic.net/zd/yy/gh/$tar"
$page = invoke-webrequest $url
$tds = $page.parsedHTML.getElementsByTagName("td")
$num = 0
for($i = 0; $i -lt $tds.length; $i++){
if($tds[$i].innerText -eq '合肥'){$num = $i; $i = $tds.length}
}
if($num -eq '404,404,404'
} else {
$pron = $tds[$num + 1].innerText + ',' + $tds[$num + 2].innerText + ',' + $tds[$num+ 3].innerText + ','
}
$num = 0
for($i = 0; $i -lt $tds.length; $i++){
if($tds[$i].innerText -eq '北京'){$num = $i; $i = $tds.length}
}
if($num -eq 0) {
$pron = '404,404,404'
} else {
$pron += $tds[$num + 1].innerText + ',' + $tds[$num + 2].innerText + ',' + $tds[$num + 3].innerText
}
} catch {
$pron = '404,404,404'
}
write-host $hanzi[$j] $pron
}
これで「文字,合肥声母,合肥韻母,合肥調値,北京声母,北京韻母,北京調値」の順番にシェルに出力されていくはずです。普通話と北京話は違う気もするんですけど,普通話は別のページに書いてあって取得が面倒くさいので北京話で許してもらうことにしました(誰に?) どの都市の発音が収録されてるかは漢字ごとに結構ばらつきがあって,もし合肥のがなかったら404を返してもらうことにしています。型とか何も考えてないコード書いちゃったけどまあいいや。で,Start-Transcriptで出力結果がtxtファイルに残ってくれるはずなので,これを適宜加工して最後に拡張子をcsvに変更します。いきなりcsvで出力する方法も絶対あると思うんですけどやり方調べるのがめんどくさかったからやめました。あと声調は対応がわかりきってるから調値はしょうみいらなかったなって終わってから思いました。で,excelで開いてフィルタリングして分析していきます。ちなみに404が返ってきた字は596字だったのでサンプルサイズは1904字ということになります。ほかにも微妙に取得に失敗してる字があるからもうちょっと小さいかもしれない。まあでも一字一字の発音を知りたいっていうよりは大局の雰囲気をつかみたいだけなのでバグ取りは放棄します。
(3月24日追記)上記コードを一般化して,文を入力すると任意都市の発音を漢典から取得して返してくれるシェルスクリプトを書きました。
結果(声母)
というわけで結果を書いていきます。まずは声母から。以下,普通話に言及する際は漢語拼音を用いますが,北京話と合肥話に言及する際には発音記号で話が進むのでご注意ください。
p
84字中83字が合肥話の/p/に対応しました。残る一字は〈瓣〉で,これは/o/っていうことになってるんですけど,声母が/o/っていうことはあり得ないので,キーボード上の位置を考えてもpのタイポだと思います。
pʰ
52字すべてが合肥話の/pʰ/に対応しました。
p~pʰ
なんか両方あるやつらが四字(〈波〉〈捕〉〈堡〉〈遍〉)ありました。横着して北京話からデータを持ってきたので揺れてるんですね。普通話だとぜんぶ/p/らしいです。合肥話では,最初の三字が/p/で,あとの一字は/p/と/pʰ/で揺れていました。ということで,普通話との対応を考えると基本的には/p/:/p/が成立して,例外が合肥でも揺れている〈遍〉一字ということになります。ぜんぶの音素についてこの精度で書くのめんどくさいな,論文じゃないし大体の雰囲気を知りたい感じなので後々記述が雑になっていくかもしれません。
m
79字すべてが合肥話の/m/に対応しました。
∅~m
/∅/っていうのはゼロ声母のことです。該当するのは〈芒〉一字で,普通話だと/m/のみだと思います。そして合肥話でも/m/です。うー,まじで横着しないでちゃんと普通話からデータ取ってくればよかった。以降,普通話と合肥話では一対一の対応が成立していて北京だけが揺れている場合には記述を省略します。
f
74字すべてが合肥話の/f/に対応しました。
t
88字中81字が合肥話の/t/に対応しました。〈地〉〈弟〉〈底〉〈帝〉〈第〉は,普通話では<di>であるところが,/tsɿ/になっていました。そのほか,〈低〉は有気音で/tsʰɿ/になり,〈抵〉は/t/と/ts/で揺れます。なお,北京で/ti/であって合肥で/tsɿ/にならないのはすべて入声字でした。
(23.06.12追記)Wikipedia中国語版によるとdとtsは文白異読らしいです。なので入声の傾向は偶然……?或いは何らかの因果を間に挟んだ間接的な影響に留まりそうです。
tʰ
80字中73字が合肥話の/tʰ/に対応しました。ほか,合肥話で/tsʰ/になるのが〈剃〉〈替〉〈提〉〈題〉〈蹄〉で,〈梯〉は/tʰ~tsʰ/,〈踏〉は/t~tʰ/で揺れました。この辺もぜんぶ普通話の韻母が/i/ですね,逆にそれ以外で/ts/に対応するのがあるのちょっと想像できないですけど直感的な結果が得られてよかったです。なお,揺れがある踏を除くと,北京で/tʰi/であって合肥でも破裂音のままなのはすべて入声字でした。
t~tʰ
特筆性があるのは〈蝶〉だけで,これは普通話でも<dié>か<tiě>で揺れるらしいです。コトバンクだと<dié>になってました。どうでもいいんですけど〈蝴蝶〉は北京だと儿化するらしいです。さて,合肥の発音は/tiɐʔ/~/tʰiɐʔ/です。普通話と異なり,声調は入声を保存しているので揺れず,声母だけが揺れています。
ts
45字中42字は/ts/のまま,〈族〉は有気音の/tsʰ/になり,〈造〉と〈躁〉は揺れます。
tsʰ
41字中39字はそのまま,〈茶〉はそり舌音になって/ʈʂʰa/,〈藏〉は/tɕʰiɑ̃/と/tsɑ̃/で揺れます。
(23.06.12追記)茶,これ北京がおかしいですよね
s
47字中46字がそのまま,〈束〉一字がそり舌になって/ʂuəʔ/です
n
36字中31字が/l/に対応します。〈尼〉と〈呢〉はゼロ声母になって/ɿ/,〈扭〉は/liɯ/と/ʈʂɯ/で揺れ,〈泥〉は/ɿ/と/mɿ/で揺れ,〈酿〉は/liɑ̃/陽平と/ʐɑ̃/上でゆれます。
n~s
〈尿〉一字が該当します。普通話では<niào>ですが,北京では/niau去/~/suei陰平/,合肥では/liɔ去/~/se陰平/です。
l
入声は/l/に,舒声はゼロになります。
ʈʂ
118字中113字がそのまま,〈宅〉〈助〉〈皱〉〈窄〉〈摘〉が/ts/になります。
ʈʂʰ
86字中74字がそのまま,韻母が/u/,/əŋ/,/uŋ/の字のうち,〈充〉〈初〉〈衬〉〈疮〉〈础〉〈称〉〈崇〉〈锄〉〈楚〉〈愁〉は/tsʰ/になり,〈辰〉〈纯〉は/ʈʂʰ/~/ʂ/で揺れます。
ʈʂ~tsʰ
〈側〉は普通話だと意味によって<cè>,<zè>,<zhāi>の三通りの読み方があり,北京には/ʈʂai陰平/と/tsʰɤ去/の二通りがあるそうです。<zè>は〈仄〉の別字として使われるときの読みなので漢典は載せなかったのかもしれません。一方〈合肥〉では,/tsʰɐʔ入/の一通りのみが記されています(ただし元文献の記述が仔細さを欠くだけかもしれません)。
ʂ
107字中88字がそのまま,韻母が/ʅ/や/əŋ/,/ən/の字のうち,〈士〉〈史〉〈师〉〈事〉〈使〉〈参〉〈驶〉〈牲〉〈狮〉〈梳〉〈深〉〈渗〉〈数〉〈瘦〉は/s/になります。〈始〉は/ʈʂ/~/ʂ/で揺れ,〈暑〉〈鼠〉〈薯〉は/ʈʂ/になります。
ʐ
基本的にはそのまま,/ʐuŋ/はゼロ声母になって/iŋ/になります。例外として〈惹〉は/∅/~/ʐ/で揺れ,〈瑞〉は/ʂue/になります。
tɕ
165字中150字がそのまま,〈己〉〈计〉〈饥〉〈记〉〈肌〉〈纪〉〈技〉〈忌〉〈际〉〈季〉〈既〉〈继〉〈基〉〈寄〉が/ts/に対応,普通話でも多音字である〈角〉は/kɐʔ入/または/tɕyɐʔ入/です。なお,北京で/tɕi/であって合肥で声母が/tɕ/のままの12字はすべて入声字でした。
tɕʰ
〈敲〉は/kʰɔ/と/tɕʰiɔ/とで揺れているようです。また,/tɕʰi/は例外なく/tsʰɿ/に対応しました。そのほかはすべてそのままです。
tɕ~tɕʰ
〈券〉は,普通話では<quàn>であるところ,北京では/tɕ/~/tɕʰ/が揺れており,合肥では(普通話とは反対に)/tɕ/でした。〈强〉は,普通話でも北京でも合肥でも多音字で,一般的な対応に従っていました(多音字は揺れとは異なるので,同一の見出しの中に書くのは不適切ですが,参照データベースの中では区別できないのでこのような書き方を取っています)。
ɕ
大まかにいって,舒声の/ɕi/と/ɕie/は/s/に対応し,そのほかはそのままでした。ただし,〈虾〉〈卸〉〈斜〉〈霞〉は舒声ながらもそのままで,〈写〉と〈谢〉は揺れていました。〈寻〉は/ɕin陽平/と/tɕʰ陽平/とがあり,〈详〉と〈祥〉は/tɕʰiɑ̃/でした。
k
80字中79字はそのままでした。〈果〉が/lʊ/上になっているのですが,少し奇妙ですし,kとlはキーボード上で隣接しているので,タイポだと思います。
k~tɕ
〈刚〉は北京,合肥ともに上記の揺れがあります。
kʰ
すべてそのままでした。
x
すべてそのままでした。
∅
216字中201字がそのまま,〈安〉〈昂〉〈岸〉〈按〉〈哀〉〈袄〉〈恩〉〈爱〉〈案〉〈偶〉〈傲〉〈碍〉〈矮〉〈额〉が/ʐ/に対応します。
結果(韻母)
疲れましたがここからが本番,韻母です。とはいっても,韻母は少し複雑すぎるので,また声母の揺れに起因する介音の有無の差異も無視することにします。実は韻母を少しやったところで挫折して後日やり直しているので,再び挫折することのないようなるべく手順を簡略化したかったのです。原則がどれほど一般的かも声母編ではn字中n字という形で示していましたが,面倒くさいので途中から省略しています。学術的な文章ではないのでご容赦ください。
a
舒声は/a/に,入声は/ɐʔ/に対応します。
ai
舒声は/ᴇ/に,入声は/ɐʔ/に対応します。〈塞〉〈伯〉〈迫〉〈脉〉は,普通話では複数の読みがありますが,合肥の韻母はすべて/ɐʔ入/です。
au
原則として舒声は/ɔ/に,入声は/uɐʔ/に対応しますが,〈造〉は/au/,〈高〉は/æ/です。
an
105字中83字は/æ̃/に対応します。一部のそり舌音の字,すなわち,〈占〉〈闪〉〈沾〉〈陕〉〈战〉〈染〉〈展〉〈粘〉〈然〉〈善〉〈缠〉〈燃〉は,/ən/と/æ̃/とで揺れがあります。〈犯〉は/fan去/のままです。一部の唇音の字,すなわち,〈半〉〈伴〉〈判〉〈盘〉〈满〉〈瞒〉は/ʊ̃/に対応し,〈漫〉は/mʊ̃/と/mæ̃/とで揺れます。
aŋ
/ɑ̃/に対応します。
ia
舒声は/ia/のまま,入声は/iɐʔ/です。
iau
基本的には/iɔ/になりますが,〈钓〉は/tiɛ/に,〈药〉は/yɐʔ/になります。
iɛn
100字中96字は/iɪ̃/に,声母が/ɕ/の字のうち,〈弦〉〈仙〉〈鲜〉は/yɪ̃/になり,〈先〉は両者で揺れます。
iaŋ
/iɑ̃/に対応します。
ua
舒声は/ua/のまま,入声は/uɐʔ/です。
uai
原則として/uᴇ/に対応しますが,外は/uᴇ/~/ue/で揺れます。
uan
43字中34字はは/ʊ̃/に,〈关〉〈环〉〈弯〉〈顽〉〈挽〉〈晚〉〈湾〉は/uæ̃/になり,〈玩〉と〈还〉は/ʊ̃/~/uæ̃/,〈软〉は/ən/~/ʊ̃/で揺れます。
uaŋ
/uɑ̃/に対応します。
yan
/yĩ/に対応します。
ɤ
原則として舒声は/ʊ/に,入声は/ɐʔ/に対応します。〈社〉〈舍〉〈遮〉は/e/になり,〈者〉は/ᴇ/になり,〈核〉は/ᴇ/~/ɐʔ/で,〈惹〉は/a/~/e/で揺れます。というか〈惹〉って本来入声字だと思うんですがここでは陰平になってるんですね。
o
舒声は/ʊ/に,入声は〈末〉〈驳〉〈拨〉〈柏〉〈博〉〈漠〉〈魄〉〈墨〉〈默〉が/ɐʔ/で,〈佛〉が/əʔ/です。
ei
舒声は/e/です。入声字は〈北〉と〈黑〉が/ɐʔ/で,〈没〉が/əʔ/です。一応-kと-tで分かれる恰好になっていますけど例が少なすぎるので確かなことは言えません。〈妹〉は/ɿ/~/e/で揺れます。/mɿ/とかいう音節許されるの……?
ou
原則として/ɯ/,〈否〉〈某〉〈谋〉は/ʊ/,入声の〈粥〉は/uəʔ/です。声母が唇音のとき,そしてそのときに限り/ʊ/になっていますが,常用字の範囲では三例しかないので断定は尚早です。
ən
すべて/ən/のままです。
əŋ
声母の唇音の17字すべてが/əŋ/のままで,唇音以外の38字はすべて/ən/に合流します。
ɚ
〈二〉〈耳〉〈而〉の三字があり,すべて/a/になります。合肥話では儿化は見られないそうです。
ie
舒声では,〈也〉〈介〉〈阶〉〈戒〉〈皆〉〈界〉〈械〉〈街〉〈解〉は/iᴇ/になり,〈姐〉〈卸〉〈借〉〈野〉〈斜〉は/i/になり,〈且〉は/ie/になります。なんか〈借〉が舒声になってるな。〈爹〉は/te/~/ti/で揺れ,声母でも言及した通り〈写〉と〈谢〉は/se/~/ɕi/で揺れ,〈夜〉は/ɿ/~/i/で揺れます。多種多様すぎて目が回りそうですが,〈也〉と〈借〉を除いては/iᴇ/は日本語の/ai/に,/ie/は日本語の/ja/に対応するような気がするので,もっと多くの字を調べて切韻と比較すれば何か見出せるかもしれません。入声は原則として/iɐʔ/になり,〈没〉一字のみ/iəʔ/になります。
iou
原則として/iɯ/に対応し,入声の〈六〉は/uəʔ/です。〈扭〉は/liɯ/~/ʈʂɯ/です。
in
すべて/in/のままです。
iŋ
原則として/in/に合流し,〈明〉は/in/~/ən/で揺れます。
uo
すべて/ʊ/になります。
uei
原則として/ue/,〈队〉〈对〉〈岁〉〈虽〉〈退〉〈脆〉〈堆〉〈随〉〈最〉〈碎〉〈罪〉〈催〉〈腿〉〈穗〉は/e/,〈醉〉は/ei/です。
uən
声母がゼロ声母と軟口蓋音,/ʐ/以外のそり舌音のときは/uən/のまま,歯茎音と/ʐ/のときは/ən/です。ただし,/ʐuən/は〈润〉一字しかなかったため,より広汎に調べれば異なる結果が出るかもしれません。
u(ə)ŋ
声母が北京で/ʐ/,合肥で/∅/のとき/iŋ/で,それ以外のときは/əŋ/です。
ye
すべて入声字で,/ɐʔ/に対応します。
yn
基本的に/yn/のままですが,〈寻〉は/in/になります。
i
舒声字は原則として/ɿ/になり,〈你〉が/li/に,〈币〉が/pe/になり,〈闭〉は/pe/~/pɿ/で揺れます。歯茎硬口蓋音が歯茎音に合流することにも留意してください。入声字は,〈役〉と〈疫〉が/yəʔ/に,他が/iəʔ/になります。〈匹〉と〈翼〉は/iəʔ/~/ɿ/で揺れます。
ɿ,ʅ
舒声は原則としてそのままです。〈使〉と〈蜘〉は/ʅ/~/e/で揺れます。入声は/əʔ/になります。
u
舒声は原則として/u/で,〈初〉〈础〉〈梳〉〈锄〉〈墓〉〈幕〉〈楚〉〈数〉〈慕〉〈暮〉は/ʊ/,〈母〉は/əŋ/~/ʊ/です。入声は唇音が/əʔ/,そのほかは/uɐʔ/です。
y
舒声は/y/のまま,入声は/yəʔ/で,〈玉〉は/y/~/yəʔ/です。
表
このまま終わらせるのも尻切れとんぼですし,割と見にくいので,取り敢えず法則の部分だけでも表にしてまとめて終わりにしようと思います。まずは声母から。三字以上にあてはまる例のあった対応を書き出しています。上(色付き)が北京語/普通話,下(色なし)が合肥話です。
p | t | ʈʂ | tɕ | k |
p | t, ts | ʈʂ | tɕ, ts | k |
pʰ | tʰ | ʈʂʰ | tɕʰ | kʰ |
pʰ | tʰ, tsʰ | ʈʂʰ | tɕʰ, tsʰ | kʰ |
m | n | |||
m | l, ∅, ʐ | |||
f | s | ʂ | ɕ | x |
f | s | ʂ | ɕ, s | x |
ts | ||||
ts | ||||
tsʰ | ||||
tsʰ | ||||
l | ʐ | ∅ | ||
∅, l | ʐ | ∅, ʐ |
続いて韻母。こちらもおおむね三字以上の対応をもって規則としています。括弧とスラッシュで区切られているペアは声母による相補分布で,より頻度が高いほうを左に書いており,それぞれ(丸括弧)は右が唇音,<三角括弧>は右が歯茎音と/ʐ/,{波括弧}は右が北京の/ʐ/,合肥の/∅/,[角括弧]は右が歯茎破擦音・摩擦音とそり舌音の場合です。
a | ai | au | an | aŋ |
a, ɐʔ | ᴇ, ɐʔ | ɔ, uɐʔ | æ̃ | ɑ̃ |
ia | iau | iɛn | iaŋ | |
ia, iɐʔ | iɔ | iɪ̃ | iɑ̃ | |
ua | uai | uan | uaŋ | |
ua, uɐʔ | uᴇ | ʊ̃, uæ̃ | ɑ̃ | |
yan | ||||
yɪ̃ | ||||
(ɤ/o) | ei | ou | ən | əŋ |
ʊ, ɐʔ | e, ɐʔ, əʔ | (ɯ/ʊ), uəʔ | ən | (ən/əŋ) |
ie | iou | in | iŋ | |
iᴇ, i, iɐʔ, iəʔ | iɯ, uəʔ | in | in | |
uei | uən | uəŋ, uŋ | ||
ue, e | <uən/ən> | {əŋ/iŋ} | ||
ye | yn | |||
ɐʔ | yn | |||
[i/ɿ, ʅ] | u | y | ||
ɿ, ʅ, [iəʔ/əʔ] | u, ʊ, (uɐʔ/əʔ) | y, yəʔ |
(3月24日追記)使用した合肥話と北京話の発音データをアップロードします。