2015年1月26日月曜日

サンプルデータ

hive, spark で使えそうなサンプルデータ

Lahman’s Baseball Database
http://seanlahman.com/baseball-archive/statistics/

The Fake Name Generator
http://www.fakenamegenerator.com/order.php


Sample Datasets from STAR Experiment
https://sdm.lbl.gov/fastbit/data/samples.html

hypertable
https://code.google.com/p/hypertable/downloads/detail?name=access.tsv.gz

2015年1月17日土曜日

scala @ centos7

これがいいのかわからないけど、とりあえずバイナリを利用する。
(たぶんこれが一番簡単だと思う)

https://sites.google.com/site/scalajp/home/installation
を参考に。

http://www.scala-lang.org/download/ から
scala-2.11.5.tgz をダウンロード。

# mv scala-2.11.5 /usr/local/share
# cd /usr/local/share
# ln -s scala-2.11.5 scala

/etc/profile.d/scala.sh を作成しておく
(自分の.bashrc に書いてもOK)
export SCALA_HOME=/usr/local/share/scala
export PATH=$PATH:$SCALA_HOME/bin
 
# source /etc/profile.d/scala.sh
# scala -version
> Scala code runner version 2.11.5 -- Copyright 2002-2013, LAMP/EPFL
 
REPLで動作確認
# scala                                                                                         
Welcome to Scala version 2.11.5 (OpenJDK 64-Bit Server VM, Java 1.7.0_75).
Type in expressions to have them evaluated.
Type :help for more information.

scala> println("Hello World")
Hello World
 
 


次はmavenで。