twitterでつぶやいた言葉をmecabで分解する[4]-phpで動かす

って訳でそのままmecabphpで動かすことにしました。

参考にしたのは、
http://kudelab.com/archives/15
ですね(笑)ってかここに書いてあることそのままやったら出来ます(笑)

<?php
$descriptorspec = array(
      0 => array("pipe", "r")
    , 1 => array("pipe", "w")
	);
	
	$text="解析したいテキストを入れる";
$process = proc_open("/mecab-0.96/src/mecab(mecabが入ってるパス)", $descriptorspec, $pipes);
if (is_resource($process)) {
    fwrite($pipes[0], $text);
    fclose($pipes[0]);
    $result = stream_get_contents($pipes[1]);
    fclose($pipes[1]);
	proc_close($process);
	
	}
	//echo $result;//resultには結果が入っている。
	
	$elementLines = split("\n",  $result);//改行で区切る
	$kazu = count($elementLines);
	
	for($i=0;$i<$kazu;$i++){
	//$elements = replace(",",  $elementLines);
	$words[$i] = split("\t", $elementLines[$i]);//タブで区切る
	$partOfSpeechData[$i] = explode( ",", $words[$i][1] );
	echo $words[$i][0]."\t".$partOfSpeechData[$i][0]."<br>";
	//最終的には、$words[$i][0]に単語が、$partOfSpeechData[$i][0]に品詞が入る形になっている。
	}

?>

実行結果↓↓

twitterでつぶやいた言葉をmecabで分解する[3]-php拡張モジュール-

PHP拡張モジュールをインストールしようとしたのですが、なかなか上手く出来ないので、
拡張モジュールを使わずにmecabを動かす事にしました。

ちなみに拡張モジュールは、
http://page2.xrea.jp/#php_mecab
でダウンロードできます。

そして、
$ tar xvzf php_mecab-0.2.0.tgz
$ cd php_mecab-0.2.0
$ phpize
$ ./configure --with-php-config=[php-configのあるパス] --with-mecab=[mecab-configのあるパス]
(ここまでは上手くいく)
$ make
(ここからエラー涙)
$ sudo make install

で出来るはずなのですが、何故かmakeの時点でエラーがでる。
何故か調べたら、多分だけど私のPCとバージョンがあってないんだと思います。

ので拡張モジュールを使うのはあきらめました☆笑★

twitterでつぶやいた言葉をmecabで分解する[2]-mecabのダウンロード-

☆★まずmecabをマックに入れる☆★

1.mecabのページからmecabをダウンロードする
 http://mecab.sourceforge.net/
もちろんUNIXの方ですよん☆

3.Xcodeをダウンロードして、インストールする(開発環境が整っていない場合)
http://ja.wikipedia.org/wiki/Xcode
http://bathyscaphe.sourceforge.jp/cgi-bin/wiki.cgi?p=Xcode+Tools+%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB

注:私のmacは、バージョン10.6.2なので、
最新バージョン


* Mac OS X 10.6 (Snow Leopard) では、3.2
* Mac OS X 10.5 (Leopard) では、3.1.3
* Mac OS X 10.4 (Tiger) では、2.5 が現在の最新バージョンです (2009-08-27)。

の中の3.2が必要でしたーー☆笑☆
つまりこれ↓↓
http://developer.apple.com/technology/xcode.html


2.ここに書いてある操作をする☆
http://d.hatena.ne.jp/nyaago69/20090404/1238831497


ちなみにsuで通らない場合は、
sudo su って入れると通る場合があります。


って分けてmecabmacに入れる事が出来ました★★

さてさて次は、mecabPHP拡張モジュールのダウンロードに移る!!!

twitterでつぶやいた言葉をmecabで分解する

おはようございます。
今日は、『twitterでつぶやいた言葉をmecabで分解する』って事をやりたくて、ブログにかいています。
初めてなので、出来るか不安ですが出来るとこまでがんばってみようと思います。

使うもの

PHP
•twitterAPI
mecab

最近パソコンをmacにかえたので、これから全部mac対応で書きたいと思います。

まず、
楽に開発するためにMAMPをダウンロード☆
http://arisa.biz/%E4%BE%BF%E5%88%A9%E3%82%A2%E3%82%A4%E3%83%86%E3%83%A0/2009-03-28/mac%E3%81%ABmanp%E3%82%92%E5%85%A5%E3%82%8C%E3%81%A6%E3%81%BF%E3%81%9F%EF%BC%81/

macのダウンロードからインストールの流れが楽すぎてビビる(笑)

普通はmacなら、『サイト』フォルダーで出来るんだけど、今後の開発の事を考えて、ちゃんとプログラム言語(ルビーとかパールとか)の所在が分かっているMAMPの方がいいかなあと。

☆★次はmecabmacに対応させてphpを動かす方法を探るですっ★★

ふと思ったこと

にょにょにょ、今学校ーー笑

図書館に並べてある本の並び順って、
面白いね。

確かに、哲学は全ての学問の基本だから数字が低いのはわかるよーな気がするんだけど、、それにしても、ほんの並び順の
0番にコンピュータがきたことは、これからコンピュータが発達していくっていう暗示なのでしょうか(笑)


そんなことどーでもいいけど、図書館の本の並びもそうだけど、

カテゴリー分けって面白いよね。

どう分けるかも色々な視点があって面白いけど、
分けたものによって、意味を表すことが出来るから。

例えば、
本、道、ぺん

っていう要素があったとしたら、

人工物かなーとか、
地球にあるものかなあとか、
大学にいる本を見ながら歩いている人を表そうとしているのかなあとか、

いろんな新しい意味を産めるよね。

一般的に、
要素があつもあると
その要素の集合は、上位概念で表すだろうけど、

(例えば、りんご、バナナ、が下位概念だとしたら、
果物は上位概念)

本、道、ぺん
と大学にいる本を見ながら歩いている人って
上位とか、下位とか無いきがするんだよね。

要素から
その上位とか下位とかない意味を生み出す能力が
発想する能力なんじゃないかって最近思うのです。


そーそー関係ないけど、

例えば、ある語を検索したら、
googleみたいにその語をピンポイントで照合して、一気に羅列するわけじゃなくて、
(そうすると、見られるサイトはべき乗分布してしまうから)


その語とある一定の関連性をもった
関係性のありそうな範囲のキーワードが検索されたとしたらどうなるんでしょう。


語と語間のゆるいつながりで検索されるの。

その検索のアルゴリズム考えないといけないんだけど、
私は、頭ばかだから無理だな(笑


っていうか
「パソコンで検索する」っていう行為はみんなが慣れすぎてて、
「検索」っていう言葉からイメージできるものが
狭意になってしまっているから

今から開発する「検索」システムを「検索」って言葉にしてしまうのが好きじゃないなあ

意味わからぬことをメモした

にょーん笑笑