Twitterからデータを取得する（１）

Twitter APIを利用してデータを取得してみる。1.pip/oauthをインストール # curl -kL https://bootstrap.pypa.io/get-pip.py | python # pip install requests requests_oauthlib 2. コードを書く # mkdir twitter # cd twitter 設定ファイルを作成。 # vim …

2016-08-24

DockerでHadoopを動かす（１）

DockerでHadoopを動かしてみる。基本は以下のサイトどおり。https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/SingleCluster.html １．Hadoopインストール wget http://apache.claz.org/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.…

2016-07-27

Docker上でKafkaを動かす（２）

技術ネタ

今回は前回構築した１コンテナでのKafkaを複数コンテナにしてみる。複数コンテナを構成するには、docker-composeを利用すると便利らしい。ということでdocker-composeを使ってみる。１．Docker-composeのインストール # curl -L https://github.com/docker…

2016-07-20

Docker上でKafkaを動かす（１）

技術ネタ

前回Sparkを入れてみたが、前段のデータのキューの部分を実現したくなった。事情により今回からCentOS7の仮想マシン上に構築している。１．まずはDockerを入れる。 # yum -y install docker-io ２．Docker上でCentos7のイメージを起動する。コンテナが起…

2016-07-13

Sparkいれてみた

技術ネタ

CentOS 6.8に入れてみる。１．インストール・scala # rpm -ivh http://downloads.lightbend.com/scala/2.10.6/scala-2.10.6.rpm ・spark # wget http://ftp.riken.jp/net/apache/spark/spark-1.6.2/spark-1.6.2-bin-hadoop2.6.tgz # tar xvzf spark-1.6.2-…

DIY

とりあえずやってみるのメモ。技術的なメモもありますが、独り言もあります。

2016-01-01から1年間の記事一覧

Twitterからデータを取得する（１）

DockerでHadoopを動かす（１）

Docker上でKafkaを動かす（２）

Docker上でKafkaを動かす（１）

Sparkいれてみた