Siang-tan-ūi

From Lohankhapedia
Jump to navigation Jump to search

雙單位 (Siang-tan-ūi) (bigram) () ()1 (cho͘) (ū)2 (ê)單位 (tan-ūi) (ê)資料 (chu-liāu)比論 (pí-lūn) (kóng)2个字母 (jī-bó) (letter), 2个音節 (im-chat) (syllable), (iah)是2个 () (word)。 (Ēng) (lâi)分析 (hun-sek)文本 (bûn-pún) (text) 簡單 (kán-tan) (koh)有事使 (ū-sū-sái)當做 (Tòng-chò)語言 (gí-giân)模式 (bô͘-sek) (language model) 來 (chò)語音 (gí-im)辨識 (piān-sek) (speech recognition) () (kài) (chán) (Collins, 1996)。雙單位 (sǹg)N單位 (N-gram) 的1个特例 (te̍k-lē)

分類 (Hun-lūi)[edit]

閬縫 (Làng-phāng)雙單位 (Gappy bigramskipping bigram) ()2个單位中央 (tiong-ng)有閬縫, (chhiūⁿ) (làng) (koè)連接二 (liân-chiap-jī) (connecting word),猶是講 (ti)倚賴 (oá-loā)文法 (bûn-hoat) (dependency grammar) 內底 (lāi-té) (beh)模仿 (bô͘-hóng)倚賴的關係 (koan-hē)

頭二 (Thâu-jī)雙單位 (Head word bigram) 就是1 (chióng)明確 (bêng-khak)倚賴關係的閬縫雙單位。

路用 (Lō͘-ēng)[edit]

()密碼學 (bi̍t-bé-ha̍k) (cryptography) 有1種雙單位頻率 (pîn-lu̍t)攻擊 (kong-kek) (bigram frequency attack),利用 (lī-iōng)頻率分析 (frequency analysis) 來 (kái)phòa暗碼 (àm-bé) (cryptogram)。

理論 (Lí-lūn)[edit]

()知影 (chai-iáⁿ)雙單位的機率 (ki-lu̍t) (kap)頭前 (thaû-chêng) (hit)个單位的機率, (lán)會得 (ē-tit)Bayes定理 (tēng-lí) (Bayes' theorem) 來算後壁 (aū-piah)彼个單位的條件 (tiâu-kiāⁿ)機率:

()就是講,若知影 的機率,按呢 (án-ne) 的機率 ()是雙單位的機率 (khì)除以 (tû-í)頭前 (thâu-chêng)單位 的機率。

相關 (Siong-koan)文章 (bûn-chiuⁿ)[edit]