ツイート解析による株価予報の手法について

株を買ったらいいのか、売ったらいいのか、わからないよ!

そうだね。とても難しいよ。でも、ツイートを解析すればヒントがわかるかもしれないね。

ツイート解析って何???

ツイートって、とてもたくさんの人がいろいろなことを呟いているよね。その中に、株式市場への考え方が含まれていると思わない?

確かに! でも、たくさんあって見るのが大変だよ! それに、株価が上がるって言っている人もいれば、下がるって言っている人もいるよ! どうすればいいの?

人の力では、とてもじゃないけどできないね。だから、ツイートを取得して、データ分析を行うプログラムを書いて、株式市場に対する期待感を求めるんだ。それを参考にすれば、判断のヒントになるかもしれないね。

はえ〜! よくわからないけど、すごいね!!

はじめに

将来の株価は、市場に対する期待感から大きな影響を受けると思われます。このため、市場に対する期待感を数字として表現することができれば、近い将来の株価がある程度わかるかもしれません。でも、市場に対する期待感はとても多くの人たちの考え方の集合によって形作られるため、数字で表現するというのも、なかなか難しい話です。

ともあれ、何かしらこれができると面白いなと思いましたので、少し考えてみました。このために、日本でもっともよく使われているSNS、ツイッターに注目しました。ツイッターには多くの人々が参加しており、日々莫大な量のツイートが発信されます。その中に、日経平均やテーマ銘柄への期待感が隠れ潜んでいると考えたためです。そのため、これをリアルタイムに解析するプログラムを開発することで、日本株式に対する期待感を数字で表現する方法を考え、実装してみました。

本HPは、皆様の投資活動に活用できるようにするため、定期的にこの情報を発信することにしました。なお、この手法は株価の増減を予測するようなものではありませんので、あくまでも一つの情報として、各々の責任でご活用いただければと思います。

公開先はこちら

手法の概要

本ページで考案した手続の概略は以下となります。

  1. ある特定時間に、Twitter APIを活用し、日経平均の将来やテーマ株(AI、海運、旅行など)に言及しているツイートを取得します。
  2. 自然言語処理技術(形態素解析、Word2Vectorなど)を活用し、それらのツイートが、市場への期待感をどの程度表しているのか、数字として表現します。
  3. 検出されたすべてのツイートに対してこれを適用し、総合的な判断結果を求めます。

キーワード

Python、Twitter API、プログラミング、全自動処理、自然言語処理、形態素解析、Word2Vector、機械学習、人工知能