叢雲配列
2006/07/08_182122第1打鍵 ●の後に入力 ★の後に入力 ぃょ●たさ つて●っぁ ぴびだざ づでぶぷ ぅみひめむ ぬらふよぇ しい★かな のと★んう じぐぞがげ ぜどごぎヴ えくそあけ せまこきり す、もはゅ ゃおに。る ずぽぼばぱ ーをぢぺべ ぉれほわゆ やねちろへ
「こいつは何だい?」
実は、趣味で日本語入力用のキー配列を考えたりしているのですが、そのうちの1つです。花配列や月配列の同類ですね。
けっこうパズルみたいで面白いんですよね。
「こらまた……あいかわらず我が道を行っているね」
ほっといてください。普通なら花配列や月配列を使っていればいいのですが、そこはそれ、だんだん不満がたまってきて、結局自分で作りました。
「自家製症候群……とでも名付けようかね」
ただ、花配列や月配列を単に修正しただけというのはつまらないので、叢雲配列は下記のようなコンセプトを定めて設計しました。
- ホームポジション!ホームポジション!!中指シフト!中指シフト!!
打鍵数より打ちやすさ優先で - 小指上段はステ
- 遠い1打よりホームポジションの2打だよね
- 同指異段はできるだけ避けよう……でも人差指の同指異段はあきらめ。
- 第1打鍵は効率優先。第2打鍵は他のキーと重ねます
- 濁音文字は清音文字と同じ位置で
設定ファイルを叢雲配列にしたさいころえんぴつを ここに置いておきます。
(右altまたは半角/全角ボタンで、かな入力<->アルファベット入力を切替えます。)
以下は蛇足の解説(作りかけ)です。
出現頻度
その前にまずはベースとなるデータを。 かな文字の出現頻度です。
い 6.27% ん 5.18% う 4.30% し 3.76% か 3.72% な 3.06% の 2.89% と 2.84% た 2.84% て 2.57% っ 2.39% く 2.20% に 2.12% は 2.02% き 1.99% が 1.98% る 1.93% で 1.92% こ 1.85% 。 1.82% す 1.78% ま 1.71% も 1.68% ら 1.68% だ 1.67% 、 1.59% お 1.48% じ 1.46% あ 1.44% れ 1.41% ょ 1.38% り 1.36% つ 1.28% さ 1.22% ち 1.20% け 1.09% ー 1.08% よ 1.03% ど 0.96% せ 0.87% み 0.87% え 0.85% そ 0.83% わ 0.77% を 0.75% や 0.71% ろ 0.69% ゅ 0.67% ゃ 0.67% め 0.64% ば 0.61% ね 0.58% ひ 0.54% ほ 0.51% ふ 0.46% ぶ 0.45% ご 0.36% む 0.33% げ 0.32% ぎ 0.28% び 0.26% ず 0.26% ぐ 0.21% ぜ 0.20% べ 0.20% ぱ 0.20% ぼ 0.19% ゆ 0.19% ざ 0.19% へ 0.17% ぷ 0.16% ぁ 0.14% ぞ 0.14% ぽ 0.14% ぃ 0.09% ぬ 0.06% ぇ 0.06% ぴ 0.06% づ 0.06% ぺ 0.05% ぉ 0.03% ヴ 0.01% ぅ 0.01% ぢ 0.01% ゎ 0.00% ヶ 0.00% ヵ 0.00% ゐ 0.00% ゑ 0.00% 合計:708137351個
サンプルは2ちゃんねるの2006/7/10の週の800-900レスのスレ。
「2ちゃんねるはアスキーアートとかスラングがあるから、あんまりサンプルとしては良くないような」
まあ、そうですが……M式のひとのところにある出現頻度計算基礎データもこんな感じですから、極端に間違っていることはないでしょう。
い 651 う 626 ん 574 し 419 の 393 か 319 く 267 と 266 に 263 た 261 き 241 る 226 こ 225 は 223 て 213 ょ 207 が 189 な 171 つ 170 っ 162 を 158 り 154 せ 154 じ 149 あ 139 で 137 ち 125 れ 124 ゅ 123 す 121 ら 120 さ 118 よ 105 も 101 お 100 そ 100 ど 098 け 096 だ 072 え 071 ま 070 め 069 ぶ 068 み 061 ぎ 056 わ 053 ほ 050 や 046 ふ 046 げ 045 ひ 044 ろ 041 ば 039 ご 034 ね 033 ゃ 031 む 027 へ 026 ず 025 ぞ 025 ゆ 022 ざ 020 ぼ 020 ぜ 019 ぽ 019 び 017 ぐ 016 べ 016 ぱ 013 ぉ 009 ぷ 006 づ 005 ぴ 003 ぺ 003 ぃ 002 ぬ 002 ぇ 002 ぁ 001 ぢ 000 ぅ 000 出典:「国語の文章における仮名の使用状況について」 渡辺 定久(電子技術総合研究所) 中野 洋(国立国語研究所) 情報処理学会「日本文入力方式研究会第12会資料」(1983年11月) 出典資料における調査対象 調査対象文章 : 高校教科書 9科目 9冊 原文の仮名表記部分に対応する仮名 : 451,051 原文の漢字表記部分に対応する仮名 : 724,003 対象仮名文字数合計 : 1,175,054
「2ちゃんねるは話し言葉主体なだけあって、『な』の頻度が高いね。『ま』の頻度が高いのは何でだろう?」
VIP語でもないですし、何でですかね?
「逆に『つ』『ょ』『ゅ』の頻度が低いね。熟語とか使わンのかね?」
出現頻度計算基礎データの方で『せ』『を』の頻度が高いのは、解説を中心とした高校教科書がサンプルだからでしょうか?
まあ、2ちゃんねるサンプルもそう極端に外れていることはなさそうですね。
(連語のデータを入れる予定)
はじめの一歩
まずは対象文字の選定から。『ゎヶヵゐゑ』は外しちゃっていいですよね。
「2ちゃんねる頻度表だと、0.01%未満、出現頻度計算基礎データだと対象にもなっていないね。IMEで変換できるケースも多いし」
ということで、『、。ー』も含めた84文字が対象です。ホームポジションだと、1段5キーの上中下三段、が左右あって合計30キー使えるわけですが……
「そうすると、少なくとも3面90キー必要だね」
今回はホームポジション&中指シフトということで、まずはこんな感じ。
第1打鍵 ●の後に入力 ★の後に入力 ▽□●○△ △○●□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□★○△ △○★□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
「次は?」
なんといっても打ちやすさ優先ですから、最も頻度の高い文字をおきましょう。『い』『ん』ですね。
第1打鍵 ●の後に入力 ★の後に入力 ▽□●○△ △○●□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽い★○△ △○★ん▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
「『い』を左にした理由は?」
上図の△に何を置くか、ですね。△は意外と遠いので、あまり頻度の高くない文字を置きたいと考えています。そうすると、
- 清音の出現頻度が中くらい
- 濁音の出現頻度が低い
という条件を満たす『つ』がちょうどいいんですよね。
そうすると、『いつ』『つい』などの成語の存在する『い』を置いたほうが、入力が左右交互になって都合がいい……というわけです。
第1打鍵 ●の後に入力 ★の後に入力 ▽□●○△ つ○●□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽い★○△ △○★ん▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
「でも、出現頻度計算基礎データだと頻度高めだけどね」
まあ、そうだとしても、悪くない位置だと思いますよ?いざとなったら『っ』と『つ』を同一視して漢字変換で対応する手もありますし。
次は、「い」「ん」の上下に何を置くか、ですね。
これは、「○い」「い○」「○ん」「ん○」となりにくいもので、なおかつ頻度が高いものですね。
「薬指を上下させながら頻繁に叩くのは大変そうだしな」
「ん」は「っ」でしょうね。「んっ」「っん」も普通じゃ使いませんし。
「い」は悩ましいですが……「ょ」あたりですかね。「いょ」という並びは少ないですし、「ょい」というのも「しょい(こむ)」「ちょい」「ひょい」みたいに砕けた言葉使いだけですし。普通は「ちょうい」「ひょうい」みたいに長音化するんですよね。
第1打鍵 ●の後に入力 ★の後に入力 ▽ょ●○△ つ○●っ▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽い★○△ △○★ん▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
で、下段ですが……。他に置けそうな文字は無いんですよね。
「まあ、最頻出文字だしね」
……ということで、諦めて「、。」を置くことにしました。「、。」は区切りとなる文字ですので、入力するときも一拍置くような感じになります。なので、「い、」「ん。」のように続いてもそこで区切れるのでまだ違和感が少ない、つうことですね。
第1打鍵 ●の後に入力 ★の後に入力 ▽ょ●○△ つ○●っ▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽い★○△ △○★ん▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ ▽、◎○△ △○◎。▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
「いん」並みに頻度の高い「うし」の置き場所も悩ましいですが……
「人差し指か小指のホームポジションだろうね。打ちやすさからすると人差し指なンだろうけど……」
人差し指は守備範囲が広いので、前後のキー入力が大変になる可能性がありますね。ということで小指に置きましょう。ここで薬指 --> 小指の入力は少し打ち辛いことを考慮すると、頻度の高い「いう」を左に固めるのはNGですね。「う」は右にしましょう。
濁音も自動的に決まります。
第1打鍵 ●の後に入力 ★の後に入力 ▽ょ●○△ つ○●っ▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽ しい★○△ △○★んう じ□◎○△ △○◎□ヴ ▽□◎○△ △○◎□▽ ▽、◎○△ △○◎。▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
次は頻出濁音「がでだど」です。濁音は●の後に入力することを考えると○の位置が良いでしょう。同じ手で入力するのも楽ですし。
第1打鍵 ●の後に入力 ★の後に入力 ▽ょ●た△ つて●っ▽ ▽□◎だ△ △で◎□▽ ▽□◎○△ △○◎□▽ しい★か△ △と★んう じ□◎が△ △ど◎□ヴ ▽□◎○△ △○◎□▽ ▽、◎○△ △○◎。▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
なぜこの位置にしたかは忘れました……
「あらら」
確か他の文字との兼ね合いだったかと思いますが……「つ」との繋がりだったっけな?
残る頻出は「なのくにはきるこすまもらお」ですかね。
「まずは頭から『なの』かね」
ここは順当に中段の残りに割り当てましょう。
第1打鍵 ●の後に入力 ★の後に入力 ▽ょ●た△ つて●っ▽ ▽□◎だ△ △で◎□▽ ▽□◎○△ △○◎□▽ しい★かな のと★んう じ□◎が△ △ど◎□ヴ ▽□◎○△ △○◎□▽ ▽、◎○△ △○◎。▽ ▽□◎○△ △○◎□▽ ▽□◎○△ △○◎□▽
「『の』絡みは厄介だね。これだと『との』『のと』『での』とかが同指になっちまうね」
そうですね……ここで『な』と『の』をひっくりかえせばある程度は同指は回避できるのですが……なんかしっくり来ないので止めました。
ここは特殊な打ち方をすることで回避する方向で。
「なんだい?その特殊な打ち方っつうのは」
ホームポジションから手を移動させて入力します。
例えば「と(J)の(H)」の場合は、右手を一列左側に移動させて 『J:中指 -> H:人差指』と入力します。
慣れるとこっちの方がスピーディですね。
(以下続く)
制作・著作: 野分(nowake) at fiercewinds.net (Creative Commons 表示-継承 2.1 日本)