Posts tagged: BOT

会話は難しい。

このエントリーをはてなブックマークに追加
はてなブックマーク - 会話は難しい。

無能BOTに関連検索ワードWeb APIを用いてリプライに対応させることにした。
リプライ飛んで着たらテキトーに関連語探してマルコフ+DBで。


まだまだ実装したばっかりで適当。
もっとしっかり構想を練らなければ。

とりあえず適当に質問やら会話文やらを入力してみた。


最近アニメ見てる?


最近ソング見てるんですから……!いや、どうしましたよ!!
最近無料見てる方が偉いんだろ!!ヒーロー気取りかぁ?

許容範囲内。

カーディガンズってそんなに昔なの?

カーディガンズってそんなに酷いかな?

質問返しw

あれ見てたんだw


ごめんね、ごめんね…姉さん…良い?

姉さんじゃねえ!!!しかも何かえろいぞ!!!

テストは嫌いだな

センターは…知ってるの?
テストは沢尻エリカきらいだな、これで……ダメですね

テストは沢尻知りません><そもそもテストは生き物じゃありません><

まーそれでもなかなかいい感じだ。



問題は処理時間。
毎回毎回関連検索API使ってるから、10件もリプライ飛んでこようものならだいぶ時間がかかるだろう。


ここは関連語もDBに入れるか・・・?




まあまだ許容範囲内の速度だ。とりあえずこれでうpしてみるか。
単語1文字でリプライされると仕様上うまくマルコフ連鎖できない。

1文字で来たら・・・検索APIでその語句を含む適当な文章取得してそれマルコフ用テーブルにぶち込んで新たな文章生成するか。





とりあえず今日は引きこもった。部屋から出たのは食事と風呂くらい。
TVも見なかった。まあ母親も仕事でいなかったし。


C#の教本半分ほど終わった。
前半は簡単だったからサクサク、結局BOT作って遊んだ。


カバンはTHE NORTH FACEのやつ通販で頼もう。
明日は余裕があったら立川いって靴と洋服見てこよう。


ついでにC#の基礎固めも。今月中にC#終わらせてC++の基礎くらいは出来るようにしたい。
ああそうだあとDuoかってTOEICに備えよう。

このエントリーをはてなブックマークに追加
はてなブックマーク - 会話は難しい。

無能風BOT完成

このエントリーをはてなブックマークに追加
はてなブックマーク - 無能風BOT完成

ひとまず完成。
主にMeCab+Yahoo形態素分析API+SQLiteを利用した。



MeCabの辞書にwikipediaのタイトルとHatenaKeyWordを追加、んで2chのSSスレから会話分6万行ほど抜き出してそれをMeCabで分かち書き、マルコフ連鎖用テーブル作ってDBにぶち込んだ。

で、あとはTLからpostを取得、その文章とDBを元にマルコフ連鎖で新たな文章を生成、post。

 


近々このブログを知り合い等に公開する(・・・のだろうか)ことも考えてIDは乗せないことにしよう。


しかし全く新しい文章が出来たときのwktkは半端じゃないな


反捕鯨団体シー・シェパードの元船長、ピーター・ベスーン容疑者(44)が、調査捕鯨船団の監視船「第2昭南丸」に侵入した事件で、海上保安庁は14日午前、ベスーン容疑者を艦船侵入容疑で東京地検に送検した。ベスーン容疑者の身柄は同日中に、東京・葛飾区の東京拘置所に移される。


反捕鯨団体シー・シェパードの元メイドに会うとそんなに嫌そうなのか…ま、まあいいや、やっぱり地の文のやりとりの中に出して食べてみます

いまどうしてる?

いまどうした所で何がなんだかわからねぇが敵の隙に小用を済まそうと思っているだけで完全に私を笑わせてあげるよね、その………

2chのSSスレから会話分6万行ほど抜き出してそれをMeCabで分かち書き

2chのアニメキャラ板のビリビリスレ、mixiのビリビリコミュ、その他ビリビリ関係の無い人を好きになってますぅ!!

結局のところ最初の2単語しか利用してない。
若干、というかしばしば電波的な内容になるゆえBOTだと疑う人も多いだろう。



意味不明な文章をできるだけ減らす方向で行くか、それとも電波多めを目指すか。
今後の方向性を定めなければ。



できるだけ減らすなら・・・やはり”学習”させることが必要だな
「不適切な文章を報告」みたいに、1文ずつこれはいい、これはだめって評価して、単語のつながりの”正しさ”をパラメータ化しようか。

いずれにしてもDB再再再再構築だけはゴメンだ。方向性と仕様を定めよう。


 


今後の目標


  • まともな文章を出力するようにする

このエントリーをはてなブックマークに追加
はてなブックマーク - 無能風BOT完成

BOTアイデア

このエントリーをはてなブックマークに追加
はてなブックマーク - BOTアイデア

仕様未定のまま書くとか何やってるんだ
とはいえ考える時間がない

とりあえず書き出してみる。
書きながら整理できるかもしれない。

イメージ的には
リプライ受け取る→形態素分析、名詞抜き出す→その名詞に関連した名詞使ってリプライメッセージ作成→リプライ

みたいな。
関連語句はYahoo関連検索ワードAPI使う。
DBには固有なIDを振りつつ名詞を登録、関連語句のIDもセットで登録。

じゃあ関連語句がDBに登録されてなかったらどうするのか。
新たに追加するとして、その関連語句がまたもや登録されてなかったら……

登録して登録して登録して………終わりを迎えるのか?コレ。


それともYahooのAPIが1日に50000回までリクエスト可能だから、
50000回ほど回して予め辞書作っておくか?

今更だがこれが良さそうだな。
あとはDBのサイズがどれくらいになるかか。
まあ100文字が60000行あっても44MBだったから問題なさげだな。

よし、まずは辞書作って、リプライメッセージ作成時にDBクロールして万が一なかったら新たに追加。

ついでにテンプレ的なもの作って起きたいなあ

というかマルコフ連鎖組み込むか。
そうしよう。

その時に関連語句DB使おう。

明日は外出するから移動時間ばかりだ。
そのときに更に考えてみよう。

ちなみに携帯からだと連続改行むしされるみたいだから

使ってみた。

↑2てすと。

↑3てすと。
というか文字数足りないw

このエントリーをはてなブックマークに追加
はてなブックマーク - BOTアイデア

Dansette