人気ブログランキング | 話題のタグを見る
2015年 09月 16日
頻度調査: 総語数約3万6000語
頻度調査: 総語数約3万6000語_a0051297_8343373.gifしばらく中止していた記事の保存をここのところ再開している.そのまだ総語数約3万6000語ほどしかないファイルだが,久しぶりに AntConc で使用頻度調査をやってみた.

使用ソフト: AntConc ver.3.4.3 (最新バージョンは 3.4.4)
http://www.laurenceanthony.net/software.html

左はその結果である.頻度トップ10語 (ABC順): dalam - dan - dari - dengan - di - ini - itu - tidak - untuk - yang.この顔ぶれは,300万語,200万語のときと同じで変わらない.yang がトップであることも変わらない.

-nya を数えていないランキングである.もしこの -nya を数えられるように下準備 (すなわち,katanya を kata nya とするなど) して -nya を数えれば, 2位 -nya となるはずである. 事実 -nya 893 でそうなった.

この「-nya を数えられるようにする下準備 (すなわち,katanya を kata nya とするなど)」,なかなか手間のかかる作業なので,小さなファイルならともかく,何百万語の大きなファイルでは,とてもやっていられない.そんなわけで,通常の頻度調査では,自立語でない -nya は対象外,ノーカウントである.

なお,小説の場合の使用頻度については以下参照されたい.

kembali(戻る) http://sanggar.exblog.jp/7621484/

[Sg]



[PR]

by sanggarnote | 2015-09-16 08:36 | 頻度


<< kemarau panjang...      Kindle ソフトウェア最新... >>