t_wの輪郭

Feedlyでフォローするボタン
言語処理学会第31回年次大会表彰論文ViterbiアルゴリズムMCMC法BunkaiSegment Any Text二値潜在変数の推定問題文境界認識文分割
あれ

あれ

2025/7/28 12:46:00

文分割

より一般化できそう。任意の文字列を任意の単位で分割するみたいな。
私がやりたいと思っていることに文の分割が必要と思っていたので、本論文の手法を応用できそう。


日本語では, 役割語 [7] の一種として「ナリよ」「ラジね」など無数の文末表現が発明され, 日々更新されている.

一番味わい深いところを取ってきている。


文分割を〜〜二値潜在変数の推定問題ととらえる

二値潜在変数の推定問題ってなんだろう。


ツイートやパラグラフの終わりは必ず文境界であり

データを得る方法として視点がすごく良い。
ただ、無視できるものと思うのだけど、連ツイなどでは文境界ではないものが少数ながらあるので、「必ず」よりも「ほとんど」がよさそう?