網站介紹
網站總覽
語言學習區 語言教學資源區 語料庫資源 研究團隊 相關連結 意見回饋 成果發表
首頁
English |
詞頻統計 使用說明
檢索介面呈現方式及查詢步驟 詞頻信息可從四個檢索點來做查詢:查閱詞頻排序、查閱個別詞的頻率、查閱個別頻率的詞、查閱累積詞頻。以下 以「現代漢語語料庫」詞頻統計為例,詳述各檢索點的特色及用法 ,「近代漢語語料庫」、「上古漢語語料庫」、「唐詩三百首」、「宋詞三百首」除文本範圍不同之外,詞頻統計介面與功能皆同。 • 查閱詞頻排序: 輸入數字以查詢指定詞頻排序範圍之間的詞,現代漢語語料庫詞頻統計的排序從1到93,826,1代表出現頻率最高的詞。查詢時範圍限定必須在300個詞以內,如果排序從50開始,那麼結束的數目最高不得超過349,如果輸入的數字高於350,系統也僅顯示排序從50到349的詞。例如下面輸入的數字是1和10(如下圖所示),就是使用者要查詢排序從第1到第10之間所有的詞。 按下「送出查詢」鍵,檢索結果呈現如下:
詞頻統計排序 Word
frequency ranking
From 1to 10
Rank
Word
Frequency
Percent
Cumulation
1
的(DE)
284589
5.829
5.829
2
是(SHI)
83666
1.714
7.542
3
一(Neu)
58117
1.190
8.732
4
在(P)
56424
1.156
9.888
5
有(V_2)
45436
0.931
10.819
6
個(Nf)
40974
0.839
11.658
7
我(Nh)
40312
0.826
12.483
8
不(D)
38872
0.796
13.279
9
了(Di)
36062
0.739
14.018
10
這(Nep)
33592
0.688
14.706
• 查閱個別詞的頻率: 輸入要查詢的詞以查詢該詞的頻率,例如:工作。 按下「送出查詢」鍵,檢索結果呈現如下:
個別詞的頻率 Word frequency: 工作
Rank
Word
Frequency
Percent
Cumulation
112
工作(Na)
4604
0.094
34.299
834
工作(VA)
720
0.015
57.159
3544
工作(Nv)
151
0.003
74.718
93826
工作(Na)[+nom]
1
0.000
99.712
一個詞語可能有不同的詞類,例如【工作】可以是名詞(Na),也可以是動詞(VA),如果要查名詞的詞頻,可加上標記,例如:【工作(Na)】。系統會排除其他詞類,只留下名詞,檢索結果如下: 個別詞的頻率 Word frequency: 工作(Na)
• 查閱個別詞頻的詞 輸入要檢索的詞頻數字,系統會顯示同樣頻率的所有的詞,例如在空格中輸入255,如下圖: 按下「送出查詢」鍵,檢索結果將 顯現所有使用頻率為255的詞,結果畫面呈現如下:
個別頻率的詞
Frequency for words: 255
Rank
Word
Frequency
Percent
Cumulation
2252
優點(Na)
255
0.005
69.491
2252
儘量(D)
255
0.005
69.497
2252
財務(Na)
255
0.005
69.502
2252
困境(Na)
255
0.005
69.507
2252
天氣(Na)
255
0.005
69.512
2252
大學生(Na)
255
0.005
69.517
2252
人事(Na)
255
0.005
69.523
• 查閱累積詞頻 可查詢累積頻率的覆蓋率,最常出現的詞百分比越低。例:輸入50: 按下「送出」鍵後,系統顯示累積詞頻與50%接近的詞:
|