moranajp

Toshikazu, Matsumura

2023-02-28

options(encoding="UTF-8")
library(magrittr)
library(stringr)
library(moranajp)
bin_dir <- "d:/pf/mecab/bin/" # input your environment

data(neko)
neko <- unescape_utf(neko)
head(neko)
#> # A tibble: 6 × 1
#>   text                                                                         
#>   <chr>                                                                        
#> 1 吾輩は猫である。名前はまだ無い。                                             
#> 2 どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣…
#> 3 この書生の掌の裏でしばらくはよい心持に坐っておったが、しばらくすると非常な速…
#> 4 ふと気が付いて見ると書生はいない。たくさんおった兄弟が一疋も見えぬ。肝心の母…
#> 5 ようやくの思いで笹原を這い出すと向うに大きな池がある。吾輩は池の前に坐ってど…
#> 6 吾輩の主人は滅多に吾輩と顔を合せる事がない。職業は教師だそうだ。学校から帰る…

n_match <- 
  list.files(bin_dir) %>%
  stringr::str_count("mecab") %>%
  sum()

  # if(n_match > 0){
  #   neko %>%
  #     unescape_utf() %>%
  #     moranajp_all(text_col = "text", bin_dir = bin_dir, iconv = "CP932_UTF-8") %>%
  #     print(n=100)
  # }