前のページ
Featured image of post NetApp CloudSyncサービスの様々な使い方

NetApp CloudSyncサービスの様々な使い方

NetApp CloudSync サービスを使ってオンプレミスNFSからオブジェクトストレージ(SGWS S3 API)を試してみた。

今回はオンプレミスNFSからオンプレミスオブジェクトストレージにデータを移動してみた。

今回は CloudSync サービス について紹介したいと思います。
オンプレミスのNFSサーバーからAWS S3 へデータを高速に転送するという話を多くさせていただいておりますが、実はオンプレミスでのデータ移行、クラウド内のデータ移行にも利用可能なものです。

今回はそもそもなぜ CloudSync サービスが生まれたのかと、オンプレミスの NFSサーバからオンプレミスのオブジェクトストレージへデータ転送を試してみた結果をお届けします。

CloudSync が生まれた背景 NASA ジェット推進研究所がやりたかったこと

そもそもの生まれとしてはNASAの火星探査機で収集した画像データをNASAのジェット推進研究所へ転送し、オンプレミスのサーバにある大量のデータ解析にAWSの解析サービスを使用したいという要望から生まれたソリューションです。

http://live.netapp-insight.com/detail/videos/see-more-netapp-insight-2017-videos/video/5599211315001/netapp-insight-general-session-day-3?autoStart=true&page=3

今までのNetAppのクラウド連携ソリューションとの違いはデータをそのまま AWS S3 に転送するというところになります。

S3に直接データを入れることで AWS の S3 を中心としたデータ分析系のサービスを活用し分析を行うといったことが可能となります。

NASA ジェット推進研究所では夜間に転送を実施し、分析までを終わらせるためには高速に転送を行うソリューションが必要でした。
そのような背景のもと CloudSync が生まれてきました。

今までのクラウドにデータを送るもののまとめ

ONTAP Cloud NetApp

SnapMirrorを使った転送、転送元、転送先にONTAPが必要。バックアップ、DR、ワークロードオフロードなどの様々なユースケースに利用可能。オンプレミスのONTAPがそのままクラウド上で動作する。

AltaVault

基本的にはアーカイブ・バックアップのクラウドゲートウェイとして利用される。バックアップ、DRのユースケース。ポイントは既存インフラを変更せずに導入可能、対応しているバックアップ先の多さ、データの重複排除・圧縮の効率性が特徴

StorgeGrid WebScale(SGWS)

オンプレミスからデータをS3へデータをレプリケーションする。オブジェクトストレージのレプリケーション機能。

CloudSync

オンプレミスのNFS/CIFSから直接データをS3へ送る。S3をデータレイクとして、AWS の PaaS サービスを直接利用可能となる。分析を行いたいときに高速にデータを転送可能。また、大量ファイル環境においても 高速にデータ転送が可能に。

CloudSync の使い方

ここからは CloudSync を使うための手順について確認します。
CloudSync は環境を選ばずデータを転送することができます。
アーキテクチャを説明後、実際のオペレーションを見ていただければと思います。

アーキテクチャ

NFS と S3 の間にデータを変換する 「Data broker 」が存在します。このデータブローカーにデータを送ることで宛先に適したフォーマットに変換しデータ転送を行います。

Cloud Sync の動き

一通りの手順を見てみます。以下のスクリーンショットの内容はバージョンアップにより内容が異なる可能性があります。

まずはサービスにアクセスし、ログインします。

ログインするとリレーション(転送元、転送先)を選択する画面となります。

「Add Source」、「Add Target」を選択すると選択可能な対象サーバー・サービスが見れます。今回はすべて表示されるものは記載していますが転送先、転送元すべての組み合わせが使えるわけではありません。SaaSとして提供しているため「転送先」、「転送元」は随時増えていきます。

「Add source」として選択出来るものは以下の通りです。

  • NFS Server
  • EFS
  • CIFS Server
  • S3 Bucket

「Add Target」を選択した場合は以下の通りです。

  • NFS Server
  • EFS
  • CIFS Server
  • S3 Bucket
  • Storage Grid

今回はオンプレミスのNFSとオンプレミスのStorageGridを選択しました。

仕組みの説明画面がでます。

転送元のIPを設定します。

ネットワークの疎通が取れると以下のような確認になります。

データブローカーのデプロイ先を選択します。

今回はオンプレミスを選択しました。

オンプレミスを選択するとデプロイメントの手順が表示されます。

最後まで手順を実行すると、以下のような画面となります。これでデータブローカーのインストール完了です。

該当のDatabroker をクリックして 「Continue」をクリック

転送元のディレクトリ一覧を選択します。

転送先のIPを設定します。

ポート、アクセスキー、シークレットキーを設定します。

「Continue」をクリックすると以下のバケットを読み込む画面になります。

転送先のバケットを選択します。

確認画面が表示されます。

「Create Relationship」をクリックすると同期が始まります。

転送完了画面は画面下部に進捗%が表示されます。

管理画面

リレーション毎の管理画面は以下のように見えます。

同期設定のスケジュール

手動での転送だけではなく、スケジューリングして定期的に差分転送をすることも可能です。

以下の画面の 「Sync Schedule」をクリック。

設定画面が表示されます。

スケジュールだけではなく、手動でオンデマンドに同期することもできます。

まとめ

今回は NetApp CloudSync Service について説明しました。発表当初は オンプレミスのNFSサーバーからAWS S3 へデータを高速に転送するソリューションでしたが、日々進化しており対応する転送元、転送先が追加されております。
また、大量のファイルが存在しても高速に転送出来るというのも特徴の1つです。

Built with Hugo
Theme Stack designed by Jimmy