KATOエンジニヤリング開発日誌

「アウトプット無きエンジニアにインプットもチャンスも無い」の精神で書いています

システムトレード開発基盤の開発状況をGitHubに公開します

現在システムトレード開発基盤を構築していますが、今まではスクリプトにデータベースアクセスユーザのパスワードや、接続している外部サイトのID・パスワードをスクリプトにベタ書きしていたためGitHubに公開することができていませんでした。

上記のような公開することができない情報をコンフィグファイルとして別ファイルに保管するようにしたので、今までスクリプトを管理していたBitBucketからGitHubに移行して、開発状況を順次公開していこうと思います。

続きを読む

日経平均と各日本株式との相関係数を算出するスクリプトを作成した

相関係数とは2つのデータ間にどれくらいの関係性があるかを示す指標として使われます。

KABU+では前日終値からの変動比率が取得できるので、日経平均株価と各日本株式との終値の変動比率の相関係数を算出すれば、日経平均と同じような値動きをするものと、逆に日経平均が下がるときに値上がりする株式の傾向を探ることができると思い、スクリプト化しました。

続きを読む

なぜImpalaではなくHiveを使い続けるのか

社内勉強会で表題の件について調査を行なったものをSpeaker Deckに公開したのでこちらにリンクを貼っておきます。

目次

  1. 調査動機
  2. おさらい(Hive)
  3. おさらい(Impala)
  4. HiveとImpalaの比較
  5. 一旦結論
  6. Clouderaの今後のHiveへの対応
  7. Hiveを高速化する方法について
  8. 結論と提案
  9. 参考資料

ディープラーニング検定E資格の勉強記録

現在開発を行なっている機械学習を用いた株式の分析システムでデータの収集や統計指標の計算を行なってきましたが、肝心の機械学習で株式の分析を行うための知見が足りていないことを実感してきたので勉強ついでに資格をとってしまおうと思いました。

日本ディープラーニング協会が主催している「ディープラーニング検定E資格」を今年の8月に受ける予定です。

www.jdla.org

このページはE資格の学習を記録するために定期的に更新していきます。

※最新更新日は【2019/05/13】

続きを読む

Pythonで日本株の月次平均収益率を算出するスクリプトを開発した

これまでの開発でKABU+から様々なデータを取得できるようになったので、そろそろデータの活用をしたいと思い適当な統計指標を探していたところ、下記の本に記載されている「月次平均収益率」が簡単で有意義な統計指標だと感じました。

完全独習 統計学入門

完全独習 統計学入門

「月次平均収益率」が何なのかこの本を参考にすると、「ある銘柄の株が1ヶ月間の間に何パーセント値上がり(値下がり)したかを表す指標」で、この指標を数ヶ月間に渡って集計すれば時系列データとしても使えそうに思いました。

続きを読む

Pythonスクリプトのリファクタリングを実施した

前回の記事でお伝えした通り、開発状況をGitHubに公開するようにしましたが、ソースコードは動けばいいというような感じでコーディングしていたので見映えがあまりよくありませんでした。

今回は既に運用している、「KABU+からCSVファイルを日次でダウンロードする」スクリプトのリファクタリングを行いました。

続きを読む

システムトレード開発基盤の開発状況をGitHubに公開します

現在システムトレード開発基盤を構築していますが、今まではスクリプトにデータベースアクセスユーザのパスワードや、接続している外部サイトのID・パスワードをスクリプトにベタ書きしていたためGitHubに公開することができていませんでした。

上記のような公開することができない情報をコンフィグファイルとして別ファイルに保管するようにしたので、今までスクリプトを管理していたBitBucketからGitHubに移行して、開発状況を順次公開していこうと思います。

続きを読む