2010-05-01から1ヶ月間の記事一覧

形態素解析, 語のtf-idf値を求める

calculate.rb # -*- coding: utf-8 -*- # 任意の対数の底で計算する def log_n(x,n) # n:底 return (Math::log(x))/(Math::log(n.to_f)) endjlma.rb # 受け取った文字列を形態素解析して、結果を配列に入れて返す関数 def jlma_ch(ch) # Japanese language m…

任意の対数の底で計算する

# 任意の対数の底で計算する def log_n(x,n) # n:底 return (Math::log(x))/(Math::log(n.to_f)) end

テキストファイルの文字コードを調べる

nkfという、古い漢字コード変換プログラムを利用します。ファイルの文字コードを調べる $ nkf --guess hoge.txt文字コードの変換 $ nkf -w --overwrite hoge.txt

RubyでMeCab

Macで, MeCab を Ruby から使いたい。 こちらのサイトを参考に MeCabをインストール. 一緒に rb-mecab もインストール. http://son-son.sakura.ne.jp/programming/tips_macportsmecab.html sudo port install mecab sudo port install mecab-ipadic-utf8 sud…

複数のPCを使っているときに便利なツール

研究室で2台のPCを使っているので、Dropboxを使い始めました。 すごーく便利☆

Snow LeopardでTeX

MacのマシンにTeXを入れる際に参考にさせていただいたのが、Snow LeopardでTeXというサイトです。 上手くいなかない時は、pTeX.appの初期設定を何度か試したり、再起動してみるといいです。まずは、パワポ等の資料作成に便利なLaTeXiTをこれから使います。

RとMeCabで遊ぶ。その1

言語処理の基礎を学ぼう!ということで、Rによるテキストマイニング入門を読んでいます。 その記録をメモ。 ◇ R のインストール こちらから、ダウンロード。 インストール後は、ニューの[ファイル]-[ディレクトリの変更]から、作業用ディレクトリを変更して…