JAWS-UG Summit2012にいってきた (2012-03-02)第一日目
AmazonWebService UserGroup Japanのユーザサミットにいってきました。
公式http://jaws-ug.jp/news/jaws-ug-summit-2012
AWSの東京リージョンが開設されたのが、昨年3月10日で約一年。25ある全国ユーザグループのサミット。
直前にAmazonSimpleWorkflowやAmazonDynamoDBがサービスイン、新しいエヴァンジェリスト(エバ2号機)が発表されるなど、サービスやデザインパターンの解説あり、中の人やUG幹部の講演あり、ワークショップありでAWSの一色の2日間でした。
備忘録的に走り書きメモをアップしておきます。書き落としている箇所多数
The Role of the AWS Ecosystem[Welcome to AWS Eco-System: AWSとデベロッパーエコシステム](アリエルケイマン氏)
Ecosystem Service←→Could Virtualization←→ApplicationService
Amazon DynamoDB(3/1 日本リージョンでリリース)
- Geographic Expansion
- 8 Regions
- 26 Edge locations
- Now 82Services (at 2011)
- Amazon S3 Usage
- Q4 2011 763Billion
- peak Request 500000/per second
- Price Reductions
- Scale & Innovation
- AWS Adoption
- IaaS Market Share Leader
- AWS=59%
- New Evangelistの発表
- 堀内氏(元Gumi CTO)
AWS上でアプリケーションを構築しよう[Build your own apps on AWS: AWSでクラウドデベロッパーになろう](ジェフバー @jeffbarr)
- agenda
- AWS2011 のレビュー
- 新サービスの紹介
- 新AWSロケーション
- 東京リージョン 2011/3
- GovCloud 2011/8
- ITARコンプライアント、米国政府、州、関連業者向け
- 他国の政府向けにも計画中
- 米国西(Oregon) 2011/11
- 南米(San Paulo) 2011/12
- 新AWSサービス
- EBS(Elastic Beanstalk)とは
- EBSのメリット
- AWSDirect Connect
- 専用線接続
- 1Gbps,10Gbpsの接続を選択できる
- プライベートネットワークのサブネットとして機能する
- AWSCloudFormation
- AmazonSNS
- 新AWS機能
- VirtualPrivateCloud
- S3
- 現在:7620億のオブジェクトを保存している
- サーバーサイド暗号化(S3保存時にファイルを暗号化できるオプション)
- オブジェクト有効期間設定(オブジェクト(ファイル)を自動削除できる)
- Webサイトホスティング
- IAM(Identity and Access Management)
- ユーザ認証のための基盤
- RDS(Relational Database Service)
- Oracle11g,MySQL5.5を提供
- EC2
- Amazon Cloud Front
- 20000以上のユーザ
- 26エッジロケーション(拡大中)
- IAMサポート
- WEBコンソールサポート
- ストリーミングサポート
- 20GBのオブジェクトサポート
- AMS Management Console
- AWSツールキット for Visual Studio
- AWS SDK for Ruby
- 既存のDBサービス
- NoSQLDB(SimpleDB)
- RalationalDB(RDS)
- n-Memory Cache(Elastic Cache)
- AmazonRDS
- ElasticCache
- クリックでスケール
- MultiAZ(Avaliablity Zone)(Master -Slave)
- リードレプリカ
- ビッグデータのスケーラビリティへの挑戦
- スケールすると、パフォーマンスは落ちる
- →これまではサーバをスケール、アップして解決していた
- スケールすると、パフォーマンスは落ちる
-
- 概念
- Table=Collection of items
- Item=information in a table; attribute collection
- Attribute= Name/Type/Value
- Types : String/Integer/String set/Number set
- PrimaryKey: Hash / Hash + Range
- 概念
-
- R/W のレートを起動中に変更できる。
- 2012年のAWSは?
- より多くのロケーション
- 多くの機能追加
- 新サービス
- サポート向上
- たくさんのイベント
The Changing Economics of Data[The Challenge Economics of Data: アマゾン内の事例にみる、
ビックデータ とクラウドの活用最前線] (ジョン:ラウザーJohn Rauser @jrauser)
- Case#1 Amazon association Program
月額の売上を集計し、アフィリエイタに支払いを行う。
Amazonの注文DBに接続し、2時間ごとにログファイルを書き出し、日時バッチで集計をおこなって、月次バッチで再集計し決済システムに支払額を渡していた。C++で実装。
-
- クリスマスシーズンにトラフィックが大変なことになり、集計が難しくなっていた。メモリ不足など
-
- 分散コンピューティングは難しく、マシンが1台から2台になるときに難易度は10^6乗倍となりあとはそれほど大きくならなない。
-
- メリット
- 開発者同じ概念で考えられる
- データをグループで分割できる。分割して処理できる
- 神のような開発者は不要で、優秀な開発者で扱える
- メリット
-
- 上記業務をHadoopで再実装した。
オーダーをフィルターしてS3へ保存。Hadoopクラスタ(50ノード)で計算し、結果をS3へ保存。100GBを30分で計算している
-
-
- Hadoopを使うことで、並列処理の難易度は1台のときとほとんど変わらなくなった
- 上記でもリソースのアイドル率は76%程度ある。
-
-
-
- そこで、ElasticMapReduce(EMR)ですよ。
- 処理が完了したら、リソースをリリースする。一日6時間以上使わない。
- 開発のコストとリソースコストを低減できる
-
- Case Study#2 ItemClassfication
商品ごとに「可燃物」「高価」「壊れ物」は分類が難しい(ゴルフシャツはスポーツグッズor衣類?)商品ごとのカテゴリ・ルール付け。高価なものはAmazon配送センターのハイセキュアレベルで扱う。
仕様を決め→SQLを発行してDWHに格納し→HRVListとして出力して確認→発送センターに指示
-
- 総入れ替えするには数日かかるため、新しいアルゴリズムをテストする場合そんなに待てない
Innovation is impossible to predict.(技術革新は予測不能)
-
- 分散システムの学習コストを下げることができる
-
- ところでビックデータってなに?
- 1台のサーバで扱えないデータをビックデータとしている。
- 超巨大(Extremeluy BigData(Exa, PetaByte))なものだけでない。
- 以前は1台のマシンで処理できない場合、別のマシンでシステムを構築する必要があり難易度は飛躍的に高かった。
- Hadoopをつかえば飛躍的な低減が可能。
- ところでビックデータってなに?
+#CaseStudy 3 Amazon Cloud Drive