2/12の日記の裏話
2022-02-11(金)
全体公開
解析する上で、プログラム組んだんですが、最初思いっきり失敗した。
アルファベットの出現頻度については、
excel上で比較的簡単に数えられるので難なく計算。
で得られた頻出10字、これの使い方を思いっきりミスった。
まず文字の並べ替えが面倒だったので総当たりをした。
aaaaaaaaaa~uuuuuuuuuuまで調べるぞ!
…脅威の100億通り、計算が終わるわけもなく実質フリーズしました。
仕方ない、順列計算用のプログラムネットから拾ってくるか。
順列なら360万通りだなら何とかなるやろ。
VBA使ってたんだが、再起呼び出しが多かったのか計算失敗。
7桁までは動いていたが、8桁で変数が死んだ。
(7桁4000通りで既に重かったから360万通りはそもそもフリーズしてた)
だめだ、全組み合わせを調べる方法は無理だ。
そもそも計算量無駄に多い。
で、最頻10字以外の単語除外しよ、これで1110語に絞り込み。
ここから2語の組み合わせ(60万通り)を取得し、
最頻10字を網羅できる単語の組み合わせを調べ上げた。
300組に絞り込んでからはまたexcelさんに頑張ってもらって計算。
アルファベットが良い位置にある単語を知りたいんじゃ。
結果は
rouen,tails = ルーアン(フランスの都市),尻尾
なんやこの組み合わせ…。
一応、最頻10字で1文字も被らなかった時の答えは
gyppy
hyphy
pygmy
のいづれか。
(全部知らんわ、こんな問題出るわけないよなぁ)