2011-05-29から1日間の記事一覧
私の研究内容とは離れますが、後輩くんの研究のお手伝い。 今回は"ExtractUniqueBlock"を使ってみた。 htmlソースから本文を抽出するにはいくつかの方法があるけど、朝日新聞とかのニュース記事から本文のみを抽出するってなると正規表現を駆使しても結構き…
私の研究内容とは離れますが、後輩くんの研究のお手伝い。 今回は"ExtractUniqueBlock"を使ってみた。 htmlソースから本文を抽出するにはいくつかの方法があるけど、朝日新聞とかのニュース記事から本文のみを抽出するってなると正規表現を駆使しても結構き…