しばらく中止していた記事の保存をここのところ再開している.そのまだ総語数約3万6000語ほどしかないファイルだが,久しぶりに AntConc で使用頻度調査をやってみた.
使用ソフト: AntConc ver.3.4.3 (最新バージョンは 3.4.4)
http://www.laurenceanthony.net/software.html
左はその結果である.頻度トップ10語 (ABC順): dalam - dan - dari - dengan - di - ini - itu - tidak - untuk - yang.この顔ぶれは,
300万語,200万語のときと同じで変わらない.yang がトップであることも変わらない.
-nya を数えていないランキングである.もしこの -nya を数えられるように下準備 (すなわち,katanya を kata nya とするなど) して -nya を数えれば, 2位 -nya となるはずである. 事実 -nya 893 でそうなった.
この「-nya を数えられるようにする下準備 (すなわち,katanya を kata nya とするなど)」,なかなか手間のかかる作業なので,小さなファイルならともかく,何百万語の大きなファイルでは,とてもやっていられない.そんなわけで,通常の頻度調査では,自立語でない -nya は対象外,ノーカウントである.
なお,小説の場合の使用頻度については以下参照されたい.
kembali(戻る)
http://sanggar.exblog.jp/7621484/
[Sg]
[PR]