Data & Analytics > DataFlow > ノードタイプガイド

  • ノードタイプは、手軽にフローを作成できるように事前に定義されたテンプレートです。
  • ノードタイプの種類はSource、Filter、Branch、Sinkです。
  • Source、Sinkノードタイプは、必ずテストを行ってエンドポイント情報が有効であることを確認することを推奨します。
  • アクセス制御が設定されたデータソースに接続する場合は、DataFlow IP固定機能を使用する必要があります。
  • DataFlow IP固定機能を使用する場合は、サポートにお問い合わせください。

Domain Specific Language(DSL)の定義

  • フローの実行に必要なDSL定義です。

Variable

  • {{ executionTime }}
    • フロー実行時間
  • 時間単位( unit )
    • 分 - {{ MINUTE }}
    • 時 - {{ HOUR }}
    • 日 - {{ DAY }}
    • 月 - {{ MONTH }}
    • 年 - {{ YEAR }}

Filter

  • {{ time | startOf: unit }}
    • 与えられた時間からunitで定義されたタイムゾーンの開始時間を返します。
    • [注意]韓国時間を基準に計算します。
    • ex) {{ executionTime | startOf: MINUTE }}
    • ex) {{ "2022-11-04T13:31:28Z" | startOf: MINUTE }}
      • → 2022-11-04T13:31:00Z
    • ex) {{ "2022-11-04T13:31:28Z" | startOf: HOUR }}
      • → 2022-11-04T13:00:00Z
    • ex) {{ "2022-11-04T13:31:28Z" | startOf: DAY }}
      • → 2022-11-04T00:00:00Z
    • ex) {{ "2022-11-04T13:31:28Z" | startOf: MONTH }}
      • → 2022-11-01T00:00:00Z
    • ex) {{ "2022-11-04T13:31:28Z" | startOf: YEAR }}
      • → 2022-01-01T00:00:00Z
  • {{ time | endOf: unit }}
    • 与えられた時間からunitで定義されたタイムゾーンの最後の時間を返します。
    • [注意]韓国時間を基準に計算します。
    • ex) {{ executionTime | endOf: MINUTE }}
    • ex) {{ "2022-11-04T13:31:28Z" | endOf: MINUTE }}
      • → 2022-11-04T13:31:59.999999999Z
    • ex) {{ "2022-11-04T13:31:28Z" | endOf: HOUR }}
      • → 2022-11-04T13:59:59.999999999Z
    • ex) {{ "2022-11-04T13:31:28Z" | endOf: DAY }}
      • → 2022-11-04T23:59:59.999999999Z
    • ex) {{ "2022-11-04T13:31:28Z" | endOf: MONTH }}
      • → 2022-11-30T23:59:59.999999999Z
    • ex) {{ "2022-11-04T13:31:28Z" | endOf: YEAR }}
      • → 2022-12-31T23:59:59.999999999Z
  • {{ time | subTime: delta, unit }}
    • 与えられた時間からunitで定義されたタイムゾーンのdeltaだけ引いた時間を返します。
    • ex) {{ executionTime | subTime: 10, MINUTE }}
    • ex) {{ "2022-11-04T13:31:28Z" | subTime: 10, MINUTE }}
      • → 2022-11-04T13:21:28Z
  • {{ time | addTime: delta, unit }}
    • 与えられた時間からunitで定義されたタイムゾーンのdeltaだけ足した時間を返します。
    • ex) {{ executionTime | addTime: 10, MINUTE }}
    • ex) {{ "2022-11-04T13:31:28Z" | addTime: 10, MINUTE }}
      • → 2022-11-04T13:41:28Z
  • {{ time | format: formatStr }}
    • 与えられた時間をformatStr形式で返します。
      • ios8601
      • yyyy
      • yy
      • MM
      • M
      • dd
      • d
      • mm
      • m
      • ss
      • s
    • ex) {{ executionTime | format: 'yyyy' }}
    • ex) {{ "2022-11-04T13:31:28Z" | format: 'yyyy' }}
      • → 2022
  • nested filter例
    • フローの実行が始まった日の03時のDSL表現
      • → {{ executionTime | startOf: DAY | addTime: 3\, HOUR }}

データ型別入力方法

string

  • 文字列を入力します。

number

  • 0以上の数字を入力します。
  • 入力ウィンドウの右側の矢印を利用して値を1ずつ調整できます。

boolean

  • ドロップダウンメニューからTRUEまたはFALSEを選択します。

enum

  • ドロップダウンメニューから項目を選択します。

array of strings

  • 配列に入る文字列を一つずつ入力します。
  • 文字列入力後、+ボタンをクリックすると、配列に文字列が挿入されます。
  • ex) ["message" , "yyyy-MM-dd HH:mm:ssZ", "ISO8601"]を入力したい場合、message, yyyy-MM-dd HH:mm:ssZ, ISO8601の順に配列に文字列を挿入します。

hash

  • json形式の文字列を入力します。

Source

  • フローにデータを取り込むエンドポイントを定義するノードタイプです。

Sourceノードの共通設定

プロパティ名 デフォルト値 データ型 説明 備考
タイプ - string 各メッセージに与えられた値でtypeフィールドを作成します。
ID - string ノードのIDを設定します。
このプロパティに定義された値でチャートボードにノード名を表記します。
タグ - array of strings 各メッセージに与えられた値のタグを追加します。
フィールド追加 - hash カスタムフィールドを追加できます。
%{[depth1_field]}で各フィールドの値を取得してフィールドを追加できます。

フィールド追加の例

{
    "my_custom_field": "%{[json_body][logType]}"
}

ノードの説明

  • (NHN Cloud) Log & Crash SearchノードはLog & Crash Searchからログを読み取るノードです。
  • ノードにログ照会開始時間を設定できます。設しない場合は、フローを開始する時点からログを読み込みます。
  • ノードに終了時間を入力しない場合は、ストリーミング形式でログを読み込みます。終了時間を入力すると終了時間までのログを読み込み、フローを終了します。
  • 現在、セッションログとクラッシュログはサポートしません。
  • Log & Crash Searchのログ検索APIのトークンに影響を受けます。
  • トークンが足りない場合はLog & Crash Searchにお問い合わせください。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
Appkey - string Log & Crash Searchのアプリケーションキーを入力します。
SecretKey - string Log & Crash Searchのシークレットキーを入力します。
照会開始時間 - string ログ照会の開始時間を入力します。 参考
照会終了時間 - string ログ照会の終了時間を入力します。
再試行回数 - number ログ照会に失敗したときに再試行する最大回数を入力します。
  • 照会開始時間と照会終了時間の設定
    • 照会終了時間がフロー実行時点より遅い場合でも、フローは照会終了時間まで待機せず、現在照会できるデータのみ照会した後に終了します。
  • 再試行回数設定
    • 再試行回数だけ失敗した場合、それ以上ログ照会を試みず、フローは終了します。

コーデック別メッセージ取り込み

  • Log & Crash Searchは基本的にJSON形式のデータを扱います。
  • コーデックを選択しない場合やplainの場合は、Log & Crash SearchログのJSON文字列をmessageというフィールドに含めます。
  • Log & Crash Searchログの各フィールドを活用したい場合は、jsonコーデックを使用することを推奨します。

未選択またはplain

{
    "message":"{\\\"log\\\":\\\"&\\\", \\\"Crash\\\": \\\"Search\\\", \\\"Result\\\": \\\"Data\\\"}"
}

json

{"log":"&", "Crash": "Search", "Result": "Data"}

(NHN Cloud) CloudTrail

ノードの説明

  • (NHN Cloud) CloudTrailはCloudTrailからデータを読み込むノードです。
  • ノードにデータ照会開始時間を設定できます。設定しない場合はフローを開始する時点からデータを読み込みます。
  • ノードに終了時間を入力しない場合は、ストリーミング形式でデータを読み込みます。終了時間を入力すると、終了時間までのデータを読み込み、フローを終了します。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
Appkey - string CloudTrailのアプリケーションキーを入力します。
照会開始時間 - string データ照会の開始時間を入力します。 参考
照会終了時間 - string データ照会の終了時間を入力します。
再試行回数 - number データ照会に失敗したときに再試行する最大回数を入力します。
  • 照会開始時間と照会終了時間の設定
    • 照会終了時間がフロー実行時点より遅い場合でも、フローは照会終了時間まで待機せず、現在照会できるデータのみ照会した後に終了します。
  • 再試行回数設定
    • 再試行回数だけ失敗した場合と、それ以上データ照会を試みず、フローは終了します。

コーデック別メッセージ取り込み

  • CloudTrailは基本的にJSON形式のデータを扱っています。
  • コーデックを選択しない場合、またはplainの場合は、CloudTrailデータのJSON文字列をmessageというフィールドに含めます。
  • CloudTrailデータの各フィールドを活用したい場合は、jsonコーデックを使用することを推奨します。

未選択またはplain

{
    "message":"{\\\"log\\\":\\\"CloudTrail\\\", \\\"Result\\\": \\\"Data\\\", \\\"@timestamp\\\": \\\"2023-12-06T08:09:24.887Z\\\", \\\"@version\\\": \\\"1\\\"}"
}

json

{"log":"CloudTrail", "Result": "Data"}

Source > (NHN Cloud) Object Storage

ノードの説明

  • NHN CloudのObject Storageからデータの入力を受け取るノードです。
  • オブジェクト作成時間を基準に最も早く作成されたオブジェクトからデータを読み込みます。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
バケット - string データを読み込むバケット名を入力します。
リージョン - string リポジトリに設定されたリージョン情報を入力します。
秘密鍵 - string S3が発行した認証情報秘密鍵を入力します。
アクセスキー - string S3が発行した認証情報アクセスキーを入力します。
リスト更新周期 - number バケットに含まれるオブジェクトリスト更新周期を入力します。
メタデータを含めるかどうか - boolean S3オブジェクトのメタデータをキーとして含めるかどうかを決定します。メタデータフィールドをSinkプラグインに公開するためには、filterノードタイプを組み合わせる必要があります(下のガイドを参照)。 作成されるフィールドは次のとおりです。
last_modified:オブジェクトが最後に修正された時間
content_length:オブジェクトサイズ
key:オブジェクト名
content_type:オブジェクト形式
metadata:メタデータ
etag: etag
Prefix - string 読み込むオブジェクトのプレフィックスを入力します。
除外するキーパターン - string 読み込まないオブジェクトのパターンを入力します。
処理完了オブジェクトの削除 false boolean プロパティ値がtrueの場合、読み込みが完了したオブジェクトを削除します。

メタデータフィールドの使用方法

  • メタデータを含めるかどうか設定を有効にすると、メタデータフィールドが作成されますが、別途一般フィールドに注入する作業を行わない限り、Sinkプラグインで表示されません。
  • 設定有効化時(NHN Cloud) Object Storageプラグイン後のメッセージ例
{
    // 一般フィールド
    "@version": "1",
    "@timestamp": "2022-04-11T00:01:23Z"
    "message": "オブジェクト内容..."

    // メタデータフィールド
    // ユーザーが一般フィールドとして注入するまでSinkプラグインに表示できない。
    // "[@metadata][s3][last_modified]": 2024-01-05T01:35:50.000Z
    // "[@metadata][s3][content_length]": 220
    // "[@metadata][s3][key]": "{filename}"
    // "[@metadata][s3][content_type]": "text/plain"
    // "[@metadata][s3][metadata]": {}
    // "[@metadata][s3][etag]": "\"56ad65461e0abb907465bacf6e4f96cf\""
}
  • 本(NHN Cloud) Object Storage Sourceプラグインにフィールド追加オプションが存在しますが、データ入力と同時にフィールド追加作業を行うことができません。
  • 任意のFilterプラグインの共通設定の中のフィールド追加オプションで一般フィールドとして追加します。
  • フィールド追加オプションの例
{
    "last_modified": "%{[@metadata][s3][last_modified]}"
    "content_length": "%{[@metadata][s3][content_length]}"
    "key": "%{[@metadata][s3][key]}"
    "content_type": "%{[@metadata][s3][content_type]}"
    "metadata": "%{[@metadata][s3][metadata]}"
    "etag": "%{[@metadata][s3][etag]}"
}
  • alter(フィールド追加オプション)プラグイン後のメッセージ例
{
    // 一般フィールド
    "@version": "1",
    "@timestamp": "2022-04-11T00:01:23Z"
    "message": "オブジェクト内容..."
    "last_modified": 2024-01-05T01:35:50.000Z
    "content_length": 220
    "key": "{filename}"
    "content_type": "text/plain"
    "metadata": {}
    "etag": "\"56ad65461e0abb907465bacf6e4f96cf\""

    // メタデータフィールド
    // "[@metadata][s3][last_modified]": 2024-01-05T01:35:50.000Z
    // "[@metadata][s3][content_length]": 220
    // "[@metadata][s3][key]": "{filename}"
    // "[@metadata][s3][content_type]": "text/plain"
    // "[@metadata][s3][metadata]": {}
    // "[@metadata][s3][etag]": "\"56ad65461e0abb907465bacf6e4f96cf\""
}

コーデック別のメッセージの取り込み

未選択またはplain

{
    "message":"{\\\"S3\\\":\\\"Storage\\\", \\\"Read\\\": \\\"Object\\\", \\\"Result\\\": \\\"Data\\\"}"
}

json

{"S3":"Storage", "Read": "Object", "Result": "Data"}

Source > (Amazon) S3

ノードの説明

  • S3からデータの入力を受け取るノードです。
  • オブジェクト作成時間を基準に最も早く作成されたオブジェクトからデータを読み込みます。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
エンドポイント - string S3リポジトリエンドポイントを入力します。 HTTP、HTTPS URL形式のみ入力可能です。
バケット - string データを読み込むバケット名を入力します。
リージョン - string リポジトリに設定されたリージョン情報を入力します。
セッショントークン - string AWSセッショントークンを入力します。
秘密鍵 - string S3が発行した認証情報秘密鍵を入力します。
アクセスキー - string S3が発行した認証情報アクセスキーを入力します。
リスト更新周期 - number バケットに含まれるオブジェクトリスト更新周期を入力します。
メタデータを含めるかどうか - boolean S3オブジェクトのメタデータをキーとして含めるかどうかを決定します。メタデータフィールドをSinkプラグインに表示するにはfilterノードタイプを組み合わせる必要があります(下のガイドを参照)。 作成されるフィールドは次のとおりです。
server_side_encryption:サーバー側の暗号化アルゴリズム
last_modified:オブジェクトが最後に修正された時間
content_length:オブジェクトサイズ
key:オブジェクト名
content_type:オブジェクト形式
metadata:メタデータ
etag: etag
Prefix - string 読み込むオブジェクトのプレフィックスを入力します。
除外するキーパターン - string 読み込まないオブジェクトのパターンを入力します。
削除 false boolean プロパティ値がtrueの場合、読み終わったオブジェクトを削除します。
追加設定 - hash S3サーバーと接続する時に使用する追加設定を入力します。 使用可能な設定の全リストは次のリンクをご覧ください。
https://docs.aws.amazon.com/sdk-for-ruby/v2/api/Aws/S3/Client.html
例)
{
"force_path_style": true
}

メタデータフィールドの使い方

  • メタデータを含めるかどうか設定を有効にすると、メタデータフィールドが生成されますが、別途、一般フィールドに注入する作業を行わなければ、Sinkプラグインで公開しません。
  • 設定有効化時、(Amazon) S3プラグイン後のメッセージ例
{
    // 一般フィールド
    "@version": "1",
    "@timestamp": "2022-04-11T00:01:23Z"
    "message": "オブジェクト内容..."

    // メタデータフィールド
    // ユーザーが一般フィールドとして注入するまではSinkプラグインに公開することができません。
    // "[@metadata][s3][server_side_encryption]": "AES256"
    // "[@metadata][s3][etag]": "\"56ad65461e0abb907465bacf6e4f96cf\""
    // "[@metadata][s3][content_type]": "text/plain"
    // "[@metadata][s3][key]": "{filename}"
    // "[@metadata][s3][last_modified]": 2024-01-05T02:27:26.000Z
    // "[@metadata][s3][content_length]": 220
    // "[@metadata][s3][metadata]": {}
}
  • 本(Amazon) S3 Sourceプラグインにフィールド追加オプションが存在しますが、データ 力と同時にフィールド追加作業ができません。
  • 任意のFilterプラグインの共通設定中のフィールド追加オプションで一般フィールドとして追加します。
  • フィールド追加オプション例
{
    "server_side_encryption": "%{[@metadata][s3][server_side_encryption]}"
    "etag": "%{[@metadata][s3][etag]}"
    "content_type": "%{[@metadata][s3][content_type]}"
    "key": "%{[@metadata][s3][key]}"
    "last_modified": "%{[@metadata][s3][last_modified]}"
    "content_length": "%{[@metadata][s3][content_length]}"
    "metadata": "%{[@metadata][s3][metadata]}"
}
  • alter(フィールド追加オプション)プラグイン後のメッセージ例
{
    // 一般フィールド
    "@version": "1",
    "@timestamp": "2022-04-11T00:01:23Z"
    "message": "オブジェクト内容..."
    "server_side_encryption": "AES256"
    "etag": "\"56ad65461e0abb907465bacf6e4f96cf\""
    "content_type": "text/plain"
    "key": "{filename}"
    "last_modified": 2024-01-05T01:35:50.000Z
    "content_length": 220
    "metadata": {}

    // メタデータフィールド
    // "[@metadata][s3][server_side_encryption]": "AES256"
    // "[@metadata][s3][etag]": "\"56ad65461e0abb907465bacf6e4f96cf\""
    // "[@metadata][s3][content_type]": "text/plain"
    // "[@metadata][s3][key]": "{filename}"
    // "[@metadata][s3][last_modified]": 2024-01-05T02:27:26.000Z
    // "[@metadata][s3][content_length]": 220
    // "[@metadata][s3][metadata]": {}
}

コーデック別のメッセージの取り込み

未選択またはplain

{
    "message":"{\\\"S3\\\":\\\"Storage\\\", \\\"Read\\\": \\\"Object\\\", \\\"Result\\\": \\\"Data\\\"}"
}

json

{"S3":"Storage", "Read": "Object", "Result": "Data"}

Source > (Apache) Kafka

ノードの説明

  • Kafkaからデータを受信するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
ブローカーサーバーリスト localhost:9092 string Kafkaブローカーサーバーを入力します。サーバーが複数台の場合はコンマ(,)で区切ります。 bootstrap.servers
例) 10.100.1.1:9092,10.100.1.2:9092
コンシューマーグループID dataflow string Kafka Consumer Groupを識別するIDを入力します。 group.id
内部トピックを除外するかどうか true boolean exclude.internal.topics
受信対象から__consumer_offsetsなどの内部トピックを除外します。
トピックパターン - string メッセージを受信するKafkaトピックパターンを入力します。 例) *-messages
クライアントID dataflow string Kafka Consumerを識別するIDを入力します。 client.id
パーティション割り当てポリシー - string Kafkaからメッセージを受信した時にコンシューマーグループにどのようにパーティションを割り当てるかを決定します。 partition.assignment.strategy
org.apache.kafka.clients.consumer.RangeAssignor
org.apache.kafka.clients.consumer.RoundRobinAssignor
org.apache.kafka.clients.consumer.StickyAssignor
org.apache.kafka.clients.consumer.CooperativeStickyAssignor
オフセット設定 none enum コンシューマーグループのオフセットを設定する基準を入力します。 auto.offset.reset
以下の設定はすべて、コンシューマーグループがすでに存在する場合は既存オフセットを維持します。
none:コンシューマーグループがない場合はエラーを返します。
earliest:コンシューマーグループがない場合はパーティションの最も古いオフセットで初期化します。
latest:コンシューマーグループがない場合はパーティションの最も新しいオフセットで初期化します。
オフセットコミット周期 5000 number コンシューマーグループのオフセットを更新する周期を入力します。 auto.commit.internal.ms
オフセット自動コミットするかどうか true boolean enable.auto.commit
キー逆シリアル化タイプ org.apache.kafka.common.serialization.StringDeserializer string 受信するメッセージのキーをシリアライズする方法を入力します。 key.deserializer
メッセージ逆シリアル化タイプ org.apache.kafka.common.serialization.StringDeserializer string 受信するメッセージの値をシリアライズする方法を入力します。 value.deserializer
メタデータを作成するかどうか false boolean プロパティ値がtrueの場合、メッセージのメタデータフィールドを作成します。メタデータフィールドをSinkプラグインに表示するためにはfilterノードタイプを組み合わせる必要があります(下のガイド参照)。 作成されるフィールドは次のとおりです。
topic:メッセージを受信したトピック
consumer_group:メッセージを受信するために使用したコンシューマーグループID
partition:メッセージを受信したトピックのパーティション番号
offset:メッセージを受信したパーティションのオフセット
key:メッセージキーを含むByteBuffer
Fetch最小サイズ - number 1回のfetchリクエストで取得するデータの最小サイズを入力します。 fetch.min.bytes
転送バッファサイズ - number データの転送に使用するTCP sendバッファのサイズ(byte)を入力します。 send.buffer.bytes
再試行リクエスト周期 100 number 転送リクエストが失敗した時に再試行する周期(ms)を入力します。 retry.backoff.ms
循環重複検査 true enum メッセージのCRCを検査します。 check.crcs
サーバー再接続周期 50 number ブローカーサーバーに接続が失敗した時に再試行する周期を入力します。 reconnect.backoff.ms
Pollタイムアウト 100 number トピックで新しいメッセージを取得するリクエストのタイムアウト(ms)を入力します。
パーティションあたりのFetch最大サイズ - number パーティションあたり1回のfetchリクエストで取得する最大サイズを入力します。 max.partition.fetch.bytes
サーバーリクエストタイムアウト 30000 number 転送リクエストに対するタイムアウト(ms)を入力します。 request.timeout.ms
TCP受信バッファサイズ - number データの読み込みに使用するTCP receiveバッファのサイズ(byte)を入力します。 receive.buffer.bytes
session_timeout_ms - number コンシューマーのセッションタイムアウト(ms)を入力します。
コンシューマーがその時間内にheartbeatを送信できなかった場合はコンシューマーグループから除外します。
session.timeout.ms
最大pollメッセージ数 - number 1回のpollリクエストで取得する最大メッセージ数を入力します。 max.poll.records
最大poll周期 - number pollリクエスト間の最大周期(ms)を入力します。 max.poll.interval.ms
Fetch最大サイズ - number 1回のfetchリクエストで取得する最大サイズを入力します。 fetch.max.bytes
Fetch最大待機時間 - number Fetch最小サイズ設定データが集まらない場合はfetchリクエストを送る待機時間(ms)を入力します。 fetch.max.wait.ms
コンシューマーヘルスチェック周期 - number コンシューマーがheartbeatを送る周期(ms)を入力します。 heartbeat.interval.ms
メタデータ更新周期 - number パーティション、ブローカーサーバーの状態などを更新する周期(ms)を入力します。 metadata.max.age.ms
IDLEタイムアウト - number データ転送がないコネクションを閉じる待機時間(ms)を入力します。 connections.max.idle.ms

メタデータフィールドの使用方法

  • メタデータを作成するかどうか設定を有効にすると、メタデータフィールドが生成されますが、別途一般フィールドに注入する作業を行わない限り、Sinkプラグインで公開しません。
  • 設定を有効にした時のKafkaプラグイン以降のメッセージ例 js { // 一般フィールド "@version": "1", "@timestamp": "2022-04-11T00:01:23Z" "message": "kafkaトピックメッセージ。.." // メタデータフィールド // ユーザーが一般フィールドにインジェクションするまでSinkプラグインに公開できない // "[@metadata][kafka][topic]": "my-topic" // "[@metadata][kafka][consumer_group]": "my_consumer_group" // "[@metadata][kafka][partition]": "1" // "[@metadata][kafka][offset]": "123" // "[@metadata][kafka][key]": "my_key" // "[@metadata][kafka][timestamp]": "-1" }

  • Kafka Sourceプラグインにフィールド追加オプションが存在しますが、データの取り込みと同時にフィールド追加作業を行えません。

  • 任意のFilterプラグインの共通設定にあるフィールド追加オプションを利用して一般フィールドとして追加します。
    • フィールド追加オプションの例 js { "kafka_topic": "%{[@metadata][kafka][topic]}" "kafka_consumer_group": "%{[@metadata][kafka][consumer_group]}" "kafka_partition": "%{[@metadata][kafka][partition]}" "kafka_offset": "%{[@metadata][kafka][offset]}" "kafka_key": "%{[@metadata][kafka][key]}" "kafka_timestamp": "%{[@metadata][kafka][timestamp]}" }
    • alter(フィールド追加オプション)プラグイン以降のメッセージ例
{
    // 一般フィールド
    "@version": "1",
    "@timestamp": "2022-04-11T00:01:23Z"
    "message": "kafkaトピックメッセージ。.."
    "kafka_topic": "my-topic"
    "kafka_consumer_group": "my_consumer_group"
    "kafka_partition": "1"
    "kafka_offset": "123"
    "kafka_key": "my_key"
    "kafka_timestamp": "-1"
    // メタデータフィールド
    // "[@metadata][kafka][topic]": "my-topic"
    // "[@metadata][kafka][consumer_group]": "my_consumer_group"
    // "[@metadata][kafka][partition]": "1"
    // "[@metadata][kafka][offset]": "123"
    // "[@metadata][kafka][key]": "my_key"
    // "[@metadata][kafka][timestamp]": "-1"
}

plainコーデック例

入力メッセージ

{
    "hello": "world!",
    "hey": "foo"
}

出力メッセージ

{
    "message": "{\"hello\":\"world\",\"hey\":\"foo\"}"
}

jsonコーデック例

入力メッセージ

{
    "hello": "world!",
    "hey": "foo"
}

出力メッセージ

{
    "hello": "world!",
    "hey": "foo"
}

Source > JDBC

ノードの説明

  • JDBCは与えられた周期でDBにクエリを実行して結果を取得するノードです。
  • MySQL, MS-SQL, PostgreSQL, MariaDB, Oracleドライバーをサポートします。

プロパティ説明

プロパティ名 デフォルト値 データ型 説明 備考
ユーザー - string DBユーザーを入力します。
接続文字列 - string DB接続情報を入力します。 例) jdbc:mysql://my.sql.endpoint:3306/my_db_name
パスワード - string ユーザーパスワードを入力します。
クエリ - string メッセージを作成するクエリを作成します。
カラム小文字化変換を行うかどうか true boolean クエリ結果で得られるカラム名を小文字化するかどうかを決定します。
クエリ実行周期 * * * * * string クエリの実行周期をcron-like表現で入力します。
トラッキングカラム - string 追跡するカラムを選択します。 事前定義されたパラメータ:sql_last_valueで、最後のクエリ結果で追跡するカラムに該当する値を使用できます。
以下のクエリ作成方法を参考にしてください。
トラッキングカラム種類 number string 追跡するカラムのデータ種類を選択します。 例) numeric or timestamp
タイムゾーン - string timestampタイプのカラムをhuman-readable文字列に変換する際に使用するタイムゾーンを定義します。 例) Asia/Seoul
ページングを適用するかどうか false boolean クエリにページングを適用するかどうかを決定します。 ページングが適用されると、クエリが複数に分割されて実行され、順序は保証されません。
ページサイズ - number ページングが適用されたクエリで、一度にクエリするページサイズを決定します。

クエリの作成方法

  • :sql_last_valueを使って最後に実行されたクエリの結果でトラッキングカラムに該当する値を使うことができます(初期値はトラッキングカラムの種類numericなら0, timestampなら1970-01-01 00:00:00)。
SELECT * FROM MY_TABLE WHERE id > :sql_last_value
  • 特定の条件を追加したい場合は、条件と一緒に:sql_last_valueを追加します。
SELECT * FROM MY_TABLE WHERE id > :sql_last_value and id > custom_value order by id ASC

コーデック別メッセージ入力

未選択またはplain

{
    "id": 1,
    "name": "dataflow",
    "deleted": false
}

Filter

  • 取り込まれたデータをどのように処理するかを定義するノードタイプです。

Filterノードの共通設定

プロパティ名 デフォルト値 データ型 説明 備考
ID - string ノードのIDを設定します。
このプロパティに定義された値でチャートボードにノード名を表記します。
タグの追加 - array of strings 各メッセージにタグを追加します。
タグの削除 - array of strings 各メッセージに与えられたタグを削除します。
フィールドの削除 - array of strings 各メッセージのフィールドを削除します。
フィールド追加 - hash カスタムフィールドを追加できます。
%{[depth1_field]}で各フィールドの値を取得してフィールドを追加できます。

Filter > Alter

ノード説明

  • メッセージフィールドの値を別の値に変更します。
  • 最上位フィールドのみ変更できます。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
フィールドの上書き - array of strings フィールド値を与えられた値と比較して同じ場合、他のフィールドの値を与えられた値に修正します。
フィールドの変更 - array of strings フィールドの値を与えられた値と比較して同じ場合、そのフィールドの値を指定された値に修正します。
Coalesce - array of strings 1つのフィールドに続くフィールドのうち、最初にnullではない値を割り当てます。

フィールドの上書き例

条件

  • フィールドの上書き→ ["logType", "ERROR", "isBillingTarget", "false"]

入力メッセージ

{
    "logType": "ERROR"
}

出力メッセージ

{
    "logType": "ERROR",
    "isBillingTarget": "false"
}

フィールドの変更例

条件

  • フィールドの変更→ ["reason", "CONNECTION_TIMEOUT", "MONGODB_CONNECTION_TIMEOUT"]

入力メッセージ

{
    "reason": "CONNECTION_TIMEOUT"
}

出力メッセージ

{
    "reason": "MONGODB_CONNECTION_TIMEOUT"
}

Coalesce例

条件

  • Coalesce → ["reason", "%{webClientReason}", "%{mongoReason}", "%{redisReason}"]

入力メッセージ

{
    "mongoReason": "COLLECTION_NOT_FOUND"
}

出力メッセージ

{
    "reason": "COLLECTION_NOT_FOUND",
    "mongoReason": "COLLECTION_NOT_FOUND"
}

Cipher

ノードの説明

  • メッセージフィールドの値を暗号化または復号するノードです。
  • 暗号化キーはSKMを参照します。
    • SKMキー登録の詳細についてはSKMガイド文書をご覧ください。
    • 1つのフローに複数のCipherノードが含まれていても、すべてのCipherノードは必ず1つのSKMキーリファレンスのみ参照できます。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
モード - enum 暗号化モードと復号モードのいずれかを選択します。 リストから1つを選択します。
アプリケーションキー - string 暗号化/復号に使用するキーを保存したSKMアプリケーションキーを入力します。
キーID - string 暗号化/復号に使用するキーを保存したSKMキーIDを入力します。
キーバージョン - string 暗号化/復号に使用するキーを保存したSKMキーバージョンを入力します。
暗号化/復号キーの長さ 16 number 暗号化/復号キーの長さを入力します。
IVランダム長 - number Initial Vectorのrandom bytes長を入力します。
ソースフィールド - string 暗号化/復号するフィールド名を入力します。
保存するフィールド - string 暗号化/復号結果を保存するフィールド名を入力します。

encrypt例

条件

  • mode → encrypt
  • アプリケーションキー → SKMアプリケーションキー
  • キーID → SKM対称鍵ID
  • キーバージョン → 1
  • IVランダム長 → 16
  • ソースフィールド → message
  • 保存するフィールド → encrypted_message

入力メッセージ

{
    "message": "this is plain message"
}

出力メッセージ

{
    "message": "this is plain message",
    "encrypted_message": "oZA6CHd4OwjPuS+MW0ydCU9NqbPQHGbPf4rll2ELzB8y5pyhxF6UhWZq5fxrt0/e"
}

decrypt例

条件

  • mode → decrypt
  • アプリケーションキー → SKMアプリケーションキー
  • キーID → SKM対称鍵ID
  • キーバージョン → 1
  • IVランダム長 → 16
  • ソースフィールド → message
  • 保存するフィールド → decrypted_message

入力メッセージ

{
    "message": "oZA6CHd4OwjPuS+MW0ydCU9NqbPQHGbPf4rll2ELzB8y5pyhxF6UhWZq5fxrt0/e"
}

出力メッセージ

{
    "decrypted_message": "this is plain message",
    "message": "oZA6CHd4OwjPuS+MW0ydCU9NqbPQHGbPf4rll2ELzB8y5pyhxF6UhWZq5fxrt0/e"
}

Filter > (Logstash) Grok

ノードの説明

  • 文字列を決められたルールに沿って解析して各設定フィールドに保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
Match - hash 解析する文字列の情報を入力します。
パターン定義 - hash 解析するトークンのルールのユーザー定義パターンを正規表現で入力します。 システム定義パターンについては以下のリンクをご確認ください。
http://grokdebug.herokuapp.com/patterns
失敗タグ - array of strings 文字列の解析に失敗した場合に定義するタグ名を入力します。
タイムアウト 30000 number 文字列の解析が完了するまでの待機時間を入力します。
上書き - array of strings 解析後に指定されたフィールドに値を書き込む時、そのフィールドにすでに値が定義されている場合は上書きするフィールド名を入力します。
名前が指定された値のみ保存 true boolean プロパティ値がtrueの場合、名前が指定されていない解析結果を保存しません。
空の文字列をキャプチャ false boolean プロパティ値がtrueの場合、空の文字列もフィールドに保存します。
Match時に終了するかどうか true boolean プロパティ値がtrueの場合、grok match結果がtrueならプラグインを終了します。

Grok解析例

条件

  • Match → { "message": "%{IP:clientip} %{HYPHEN} %{USER} \[%{HTTPDATE:timestamp}\] \"%{WORD:verb} %{NOTSPACE:request} HTTP/%{NUMBER:httpversion}\" %{NUMBER:response} %{NUMBER:bytes}" }
  • パターン定義 → { "HYPHEN": "-*" }

入力メッセージ

{
    "message": "127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] \\\"GET /apache_pb.gif HTTP/1.0\\\" 200 2326"
}

出力メッセージ

{
    "message": "127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] \\\"GET /apache_pb.gif HTTP/1.0\\\" 200 2326",
    "timestamp": "10/Oct/2000:13:55:36 -0700",
    "clientip": "127.0.0.1",
    "verb": "GET",
    "httpversion": "1.0",
    "response": "200",
    "bytes": "2326",
    "request": "/apache_pb.gif"
}

Filter > CSV

ノードの説明

  • CSV形式のメッセージを解析してフィールドに保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
保存するフィールド - string CSV解析結果を保存するフィールド名を入力します。
Quote " string カラムフィールドを分割する文字を入力します。
最初の行を無視するかどうか false boolean プロパティ値がtrueの場合、読み込んだデータの最初の行に入力されたカラム名を無視します。
カラム - array of strings カラム名を入力します。
セパレータ , string カラムを区切る文字列を入力します。
ソースフィールド message string CSV解析するフィールド名を入力します。
スキーマ - hash 各カラムの名前とデータ型をdictionary形式で入力します。 カラムに定義されたフィールドとは別に登録します。
データ型は基本的にstringであり、他のデータ型に変換が必要な場合はスキーマ設定を活用します。
可能なデータ型は次のとおりです。
integer、float、date、date_time、boolean

データ型がないCSV解析の例

条件

  • ソースフィールド → message
  • カラム → ["one", "two", "t hree"]

入力メッセージ

{
    "message": "hey,foo,\\\"bar baz\\\""
}

出力メッセージ

{
    "message": "hey,foo,\"bar baz\"",
    "one": "hey",
    "t hree": "bar baz",
    "two": "foo"
}

データ型がないCSV解析の例

条件

  • ソースフィールド → message
  • カラム → ["one", "two", "t hree"]

入力メッセージ

{
    "message": "hey,foo,\\\"bar baz\\\""
}

出力メッセージ

{
    "message": "hey,foo,\"bar baz\"",
    "one": "hey",
    "t hree": "bar baz",
    "two": "foo"
}

データ型変換が必要なCSV解析の例

条件

  • ソースフィールド → message
  • カラム → ["one", "two", "t hree"]
  • スキーマ → {"two": "integer", "t hree": "boolean"}

入力メッセージ

{
    "message": "\\\"wow hello world!\\\", 2, false"
}

出力メッセージ

{
    "message": "\\\"wow hello world!\\\", 2, false",
    "one": "wow hello world!",
    "t hree": false,
    "two": 2
}

Filter > JSON

ノードの説明

  • JSON文字列を解析して指定されたフィールドに保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
ソースフィールド message string JSON文字列を解析するフィールド名を入力します。
保存するフィールド - string JSON解析結果を保存するフィールド名を入力します。
プロパティ値を指定していない場合はrootフィールドに結果を保存します。

JSON解析の例

条件

  • ソースフィールド → message
  • 保存するフィールド → json_parsed_messsage

入力メッセージ

{
    "message": "{\\\"json\\\": \\\"parse\\\", \\\"example\\\": \\\"string\\\"}"
}

出力メッセージ

{
    "json_parsed_message": {
        "json": "parse",
        "example": "string"
    },
    "message": "uuid test message"
}

Filter > (Logstash) Grok

ノードの説明

  • 文字列を決められたルールに沿って解析して、各設定されたフィールドに保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
Match - json 解析する文字列の情報を入力します。
パターン定義 - json 解析するトークンのルールのユーザー定義パターンを正規表現で入力します。 システム定義パターンは以下のリンクをご確認ください。
http://grokdebug.herokuapp.com/patterns
失敗タグ - array of strings 文字列の解析に失敗する場合、定義するタグ名を入力します。
タイムアウト 30000 number 文字列の解析が行われるまでの待機時間を入力します。
上書き - array of strings 解析後、指定されたフィールドに値を書き込む際、そのフィールドにすでに値が定義されている場合、上書きするフィールド名を入力します。
名前が指定された値のみ保存 - boolean 名前が指定されていない解析結果を保存するかどうかを選択します。
空の文字列をキャプチャ - boolean 空の文字列もフィールドに保存するかどうかを選択します。

Grok解析例

条件

  • Match → { "message": "%{IP:clientip} %{HYPHEN} %{USER} \[%{HTTPDATE:timestamp}\] \"%{WORD:verb} %{NOTSPACE:request} HTTP/%{NUMBER:httpversion}\" %{NUMBER:response} %{NUMBER:bytes}" }
  • パターン定義 → { "HYPHEN": "-*" }

入力メッセージ

{
    "message": "127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] \\\"GET /apache_pb.gif HTTP/1.0\\\" 200 2326"
}

出力メッセージ

{
    "message": "127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] \\\"GET /apache_pb.gif HTTP/1.0\\\" 200 2326",
    "timestamp": "10/Oct/2000:13:55:36 -0700",
    "clientip": "127.0.0.1",
    "verb": "GET",
    "httpversion": "1.0",
    "response": "200",
    "bytes": "2326",
    "request": "/apache_pb.gif"
}

Filter > Date

ノードの説明

  • Date文字列を解析してtimestamp形式で保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
ソースフィールド - string 文字列を取得するためのフィールド名を入力します。
フォーマット - array of strings 文字列を取得するための形式を入力します。 事前定義された形式は次のとおりです。
ISO8601, UNIX, UNIX_MS, TAI64N
Locale - Date文字列を分析するために使用するLocaleを入力します。 ex) en, en-US, ko-kr
保存するフィールド - string Date文字列解析結果を保存するフィールド名を入力します。
失敗タグ - array of strings Date文字列の解析に失敗した場合に定義するタグ名を入力します。
タイムゾーン - string 日付のタイムゾーンを入力します。

Date文字列の解析例

条件

  • Match → ["message" , "yyyy-MM-dd HH:mm:ssZ", "ISO8601"]
  • 保存するフィールド → time
  • タイムゾーン → Asia/Seoul

入力メッセージ

{
    "message": "2017-03-16T17:40:00"
}

出力メッセージ

{
    "message": "2017-03-16T17:40:00",
    "time": 2022-04-04T09:08:01.222Z
}

Filter > UUID

ノードの説明

  • UUIDを作成してフィールドに保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
UUID保存フィールド - string UUID作成結果値を保存するフィールド名を入力します。
上書き - boolean 指定されたフィールド名に値が存在する場合、これを上書きするかどうかを選択します。

UUID作成例

条件

  • UUID保存フィールド → userId

入力メッセージ

{
    "message": "uuid test message"
}

出力メッセージ

{
    "userId": "70186b1e-bdec-43d6-8086-ed0481b59370",
    "message": "uuid test message"
}

Filter > Split

ノードの説明

  • 1つのメッセージを複数のメッセージに分割するノードです。
  • 設定に従って解析した結果を基にメッセージを分割します。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
ソースフィールド - string メッセージを分離するフィールド名を入力します。
保存するフィールド - string 分離されたメッセージを保存するフィールド名を入力します。
セパレータ \n string

基本メッセージ分割例

条件

  • ソースフィールド → message

入力メッセージ

{
    "message": [
        {"number": 1},
        {"number": 2}
    ]
}

出力メッセージ

{
    "message": [
        {"number": 1},
        {"number": 2}
    ],
    "number": 1
}
{
    "message": [
        {"number": 1},
        {"number": 2}
    ],
    "number": 2
}

文字列解析後の分割例

条件

  • ソースフィールド → message
  • セパレータ → ,

入力メッセージ

{
    "message": "1,2"
}

出力メッセージ

{
    "message": "1"
}
{
    "message": "2"
}

文字列解析後、他のフィールドに分割する例

条件

  • ソースフィールド → message
  • 保存するフィールド → target
  • セパレータ → ,

入力メッセージ

{
    "message": "1,2"
}

出力メッセージ

{
    "message": "1,2",
    "target": "1"
}
{
    "message": "1,2",
    "target": "2"
}

Filter > Truncate

ノードの説明

  • JSON文字列を解析して指定されたフィールドに保存するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
Byte数 - number 文字列を表現する最大byte数を入力します。
ソースフィールド - string truncate対象フィールド名を入力します。

JSON解析例

条件

  • Byte数 → 10
  • ソースフィールド → message

入力メッセージ

{
    "message": "このメッセージは長すぎます。"
}

出力メッセージ

{
    "message": "このメ"
}

Sink

  • Filter作業が完了したデータをロードするエンドポイントを定義するノードタイプです。

Sinkノードの共通設定

プロパティ名 デフォルト値 データ型 説明 備考
ID - string ノードのIDを設定します。
このプロパティに定義された値でチャートボードにノード名を表記します。

(NHN Cloud) Object Storage

ノードの説明

  • NHN CloudのObject Storageにデータをアップロードするノードです。
  • OBSに作成されるオブジェクトは、基本的に次のパスフォーマットに合わせて出力されます。
    • /{container_name}/year={yyyy}/month={MM}/day={dd}/hour={HH}/ls.s3.{uuid}.{yyyy}-{MM}-{dd}T{HH}.{mm}.part{seq_id}.txt

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
リージョン - enum Object Storage商品のリージョンを入力します。 OBSリージョンの詳細
バケット - string バケット名を入力します。
秘密鍵 - string S3 API認証情報の秘密鍵を入力します。
アクセスキー - string S3 API認証情報のアクセスキーを入力します。
Prefix /year=%{+YYYY}/month=%{+MM}/day=%{+dd}/hour=%{+HH} string オブジェクトをアップロードする時に名前の前につけるプレフィックスを入力します。
フィールドまたは時間形式を入力できます。
使用可能な時間形式
Prefix時間フィールド @timestamp string Prefixに適用する時間フィールドを入力します。
Prefix時間フィールドタイプ DATE_FILTER_RESULT enum Prefixに適用する時間フィールドのタイプを入力します。
Prefixタイムゾーン UTC string Prefixに適用する時間フィールドのタイムゾーンを入力します。
Prefix時間適用fallback _prefix_datetime_parse_failure string Prefix時間適用に失敗した場合に代替するPrefixを入力します。
エンコード none enum エンコードするかどうかを入力します。 gzipエンコードを使用できます。
オブジェクトローテーションポリシー size_and_time enum オブジェクトの作成ルールを決定します。 size_and_time:オブジェクトのサイズと時間を利用して決定
size:オブジェクトのサイズを利用して決定
time:時間を利用して決定
基準時刻 15 number オブジェクトを分割する基準となる時間を設定します。 オブジェクトローテーションポリシーがsize_and_timeまたはtimeの場合に設定
基準オブジェクトサイズ 5242880 number オブジェクトを分割する基準となるサイズを設定します。 オブジェクトローテーションポリシーがsize_and_timeまたはsizeの場合に設定

jsonコーデックの出力例

条件

  • リージョン → KR1
  • バケット → obs-test-container
  • アクセスキー → ******
  • 秘密鍵 → ******

入力メッセージ

{"hidden":"Hello DataFlow!","message":"Hello World", "@timestamp": "2022-11-21T07:49:20Z"}

出力値

  • パス
/obs-test-container/year=2022/month=11/day=21/hour=07/ls.s3.d53c090b-9718-4833-926a-725b20c85974.2022-11-21T07.49.part0.txt
  • 出力メッセージ
{"@timestamp":"2022-11-21T07:49:20.000Z","host":"755b65d82bd0","hidden":"Hello DataFlow!","@version":"1","sequence":0,"message":"Hello World"}

plainコーデック出力例 - messageフィールド存在する場合

条件

  • リージョン → KR1
  • バケット → obs-test-container
  • アクセスキー → ******
  • 秘密鍵 → ******

入力メッセージ

{
    "message": "Hello World!",
    "hidden": "Hello DataFlow!",
    "@timestamp": "2022-11-21T07:49:20Z"
}

出力値

  • パス
/obs-test-container/year=2022/month=11/day=21/hour=07/ls.s3.d53c090b-9718-4833-926a-725b20c85974.2022-11-21T07.49.part0.txt
  • 出力メッセージ
2022-11-21T07:49:20.000Z e0e40e03dd94 Hello World

plainコーデック出力例 - messageフィールドが存在しない場合

条件

  • リージョン → KR1
  • バケット → obs-test-container
  • アクセスキー → ******
  • 秘密鍵 → ******

入力メッセージ

{
    "hidden": "Hello DataFlow!",
    "@timestamp": "2022-11-21T07:49:20Z"
}

出力値

  • パス
/obs-test-container/year=2022/month=11/day=21/hour=07/ls.s3.d53c090b-9718-4833-926a-725b20c85974.2022-11-21T00.47.part0.txt
  • 出力メッセージ
2022-11-21T07:49:20.000Z f207c24a122e %{message}

Prefix例 - フィールド

条件

  • バケット→ obs-test-container
  • Prefix → /dataflow/%{deployment}

入力メッセージ

{
    "deployment": "production",
    "message": "example",
    "logTime": "2022-11-21T07:49:20Z"
}

出力パス

/obs-test-container/dataflow/production/ls.s3.d53c090b-9718-4833-926a-725b20c85974.2022-11-21T00.47.part0.txt

Prefix例 - 時間

条件

  • バケット→ obs-test-container
  • Prefix → /dataflow/year=%{+YYYY}/month=%{+MM}/day=%{+dd}/hour=%{+HH}
  • Prefix時間フィールド→ logTime
  • Prefix時間フィールドタイプ→ ISO8601
  • Prefixタイムゾーン→ Asia/Seoul

入力メッセージ

{
    "deployment": "production",
    "message": "example",
    "logTime": "2022-11-21T07:49:20Z"
}

出力パス

/obs-test-container/dataflow/year=2022/month=11/day=21/hour=16/ls.s3.d53c090b-9718-4833-926a-725b20c85974.2022-11-21T00.47.part0.txt

Prefix例 - 時間適用が失敗した場合

条件

  • バケット→ obs-test-container
  • Prefix → /dataflow/year=%{+YYYY}/month=%{+MM}/day=%{+dd}/hour=%{+HH}
  • Prefix時間フィールド→ logTime
  • Prefix時間フィールドタイプ→ TIMESTAMP_SEC
  • Prefixタイムゾーン→ Asia/Seoul
  • Prefix時間適用fallback → _failure

入力メッセージ

{
    "deployment": "production",
    "message": "example",
    "logTime": "2022-11-21T07:49:20Z"
}

出力パス

/obs-test-container/_failure/ls.s3.d53c090b-9718-4833-926a-725b20c85974.2022-11-21T00.47.part0.txt

Sink > (NHN Cloud) Object Storage - Parquet

ノード説明

  • NHN CloudのObject Storageにデータをparquetタイプに変換してアップロードするノードです。
  • OBSに作成されるオブジェクトは基本的に次のパス形式に合わせて出力されます。
    • /{container_name}/year={yyyy}/month={MM}/day={dd}/hour={HH}/ls.s3.{uuid}.{yyyy}-{MM}-{dd}T{HH}.{mm}.part{seq_id}.parquet
  • (NHN Cloud) Object Storageノードと同じですが、parquetタイプをサポートするため、一部の値が下記のように変更されます。
  • コーデックがparquetに固定
  • オブジェクトローテーションポリシーを入力しない場合、下記のように基本ポリシーが適用されます。
    • オブジェクトサイズ: 128MB(134,217,728 byte)
    • 基準時刻: 60分
  • エンコードはnoneに固定

プロパティ説明

プロパティ名 デフォルト値 データ型 説明 備考
parquet圧縮コーデック SNAPPY enum parquetファイル変換時に使用する圧縮コーデックを入力します。 参照

(Amazon) S3

ノードの説明

  • Amazon S3にデータをアップロードするノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
リージョン - enum S3商品のリージョンを入力します。 s3 region
バケット - string バケット名を入力します。
アクセスキー - string S3 API認証情報のアクセスキーを入力します。
秘密鍵 - string S3 API認証情報の秘密鍵を入力します。
署名バージョン - enum AWSリクエストを署名する時に使用するバージョンを入力します。
セッショントークン - string AWS一時認証情報のためのセッショントークンを入力します。 セッショントークンガイド
Prefix - string オブジェクトをアップロードする時に名前の前につけるプレフィックスを入力します。
フィールドまたは時間形式を入力できます。
使用可能な時間形式
Prefix時間フィールド @timestamp string Prefixに適用する時間フィールドを入力します。
Prefix時間フィールドタイプ DATE_FILTER_RESULT enum Prefixに適用する時間フィールドのタイプを入力します。
Prefixタイムゾーン UTC string Prefixに適用する時間フィールドのタイムゾーンを入力します。
Prefix時間適用fallback _prefix_datetime_parse_failure string Prefix時間適用に失敗した場合に代替するPrefixを入力します。
ストレージクラス STANDARD enum オブジェクトをアップロードする時に使用するストレージクラスを設定します。 ストレージクラスガイド
エンコード none enum エンコードするかどうかを入力します。gzipエンコードを使用できます。
オブジェクトローテーションポリシー size_and_time enum オブジェクトの作成ルールを決定します。 size_and_time:オブジェクトのサイズと時間を利用して決定
size:オブジェクトのサイズを利用して決定
time:時間を利用して決定
基準時刻 15 number オブジェクトを分割する基準となる時間を設定します。 オブジェクトローテーションポリシーがsize_and_timeまたはtimeの場合に設定
基準オブジェクトサイズ 5242880 number オブジェクトを分割する基準となるサイズを設定します。 オブジェクトローテーションポリシーがsize_and_timeまたはsizeの場合に設定
ACL private enum オブジェクトをアップロードする時に設定するACLポリシーを入力します。
追加設定 { } hash S3に接続するための追加設定を入力します。 ガイド

出力例

  • OBSと同じです。

追加設定の例

follow redirects

  • trueに設定した場合、AWS S3で307レスポンスを返す場合はredirectパスを追跡
{
    follow_redirects → true
}

retry limit

  • 4xx、5xxレスポンスの最大再試行回数
{
    retry_limit → 5
}

force_path_style

  • trueの場合、URLがvirtual-hosted-styleではなくpath-styleでなければなりません。参照
{
    force_path_style → true
}

Sink > (Amazon) S3 - Parquet

ノードの説明

  • データをparquetタイプに変換してAmazon S3にアップロードするノードです。
  • (Amazon) S3ノードと同じですが、parquetタイプをサポートするため、一部の値が下記のように変更されます。
  • コーデックがparquetに固定
  • オブジェクトローテーションポリシーを入力しない場合、下記のように基本ポリシーが適用されます。
    • 基準オブジェクトサイズ: 128MB(134,217,728 byte)
    • 基準時刻: 60分
  • エンコードはnoneに固定

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
parquet圧縮コーデック SNAPPY enum parquetファイル変換時に使用する圧縮コーデックを入力します。 参照

Sink > (Apache) Kafka

ノードの説明

  • Kafkaにデータを転送するノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
トピック - string メッセージを転送するKafkaトピック名を入力します。
ブローカーサーバーリスト localhost:9092 string Kafkaブローカーサーバーを入力します。サーバーが複数の場合はコンマ(,)で区切ります。 bootstrap.servers
例) 10.100.1.1:9092,10.100.1.2:9092
クライアントID dataflow string Kafka Producerを識別するIDを入力します。 client.id
メッセージシリアライズタイプ org.apache.kafka.common.serialization.StringSerializer string 転送するメッセージの値をシリアライズする方法を入力します。 value.serializer
圧縮タイプ none enum 転送するデータを圧縮する方法を入力します。 compression.type
none、gzip、snappy、lz4から選択
キーシリアライズタイプ org.apache.kafka.common.serialization.StringSerializer string 転送するメッセージのキーをシリアライズする方法を入力します。 key.serializer
メタデータ更新周期 300000 number パーティション、ブローカーサーバー状態などを更新する周期(ms)を入力します。 metadata.max.age.ms
最大リクエストサイズ 1048576 number 転送リクエストごとの最大サイズ(byte)を入力します。 max.request.size
サーバー再接続周期 50 number ブローカーサーバーに接続が失敗した時に再試行する周期を入力します。 reconnect.backoff.ms
バッチサイズ 16384 number バッチリクエストで転送するサイズ(byte)を入力します。 batch.size
バッファメモリ 33554432 number Kafka転送に使用するバッファのサイズ(byte)を入力します。 buffer.memory
受信バッファサイズ 32768 number データの読み込みに使用するTCP receiveバッファのサイズ(byte)を入力します。 receive.buffer.bytes
転送遅延時間 0 number メッセージ転送を遅らせる時間を入力します。遅延したメッセージはバッチリクエストで一度に転送します。 linger.ms
サーバーリクエストタイムアウト 40000 number 転送リクエストのタイムアウト(ms)を入力します。 request.timeout.ms
メタデータ照会タイムアウト number https://kafka.apache.org/documentation/#upgrade_1100_notable
転送バッファサイズ 131072 number データを転送するのに使用するTCP sendバッファのサイズ(byte)を入力します。 send.buffer.bytes
ackプロパティ 1 enum ブローカーサーバーでメッセージを受信したことを確認する設定を入力します。 acks
0 - メッセージを受信したかどうかを確認しません。
1 - トピックのleaderが、followerがデータをコピーすることを待たずにメッセージを受信したというレスポンスを返します。
all - トピックのleaderが、followerがデータをコピーするのを待ってからメッセージを受信したというレスポンスを返します。
リクエストの再接続周期 100 number 転送リクエストが失敗した時に再試行する周期(ms)を入力します。 retry.backoff.ms
再試行回数 - number 転送リクエストが失敗した時に再試行する最大回数を入力します。 retries
設定値を超えて再試行すると、データが消失する可能性があります。

jsonコーデックの出力例

入力メッセージ

{
    "message": "Hello World!",
    "hidden": "Hello DataFlow!",
    "@timestamp": "2022-11-21T07:49:20Z"
}

出力メッセージ

{"host":"0bc501d89f8c","message":"Hello World","hidden":"Hello DataFlow!","sequence":0,"@timestamp":"2022-11-21T07:49:20.000Z","@version":"1"}

plainコーデック出力例

入力メッセージ

{
    "message": "Hello World!",
    "hidden": "Hello DataFlow!",
    "@timestamp": "2022-11-21T07:49:20Z"
}

出力メッセージ

2022-11-21T07:49:20.000Z 2898d492114d Hello World

plainコーデック出力例 - messageフィールドが存在しない場合

入力メッセージ

{
    "hidden": "Hello DataFlow!",
    "@timestamp": "2022-11-21T07:49:20Z"
}

出力メッセージ

2022-11-21T07:49:20.000Z e5ef7ece9bb0 %{message}

Branch

  • 取り込まれたデータの値に基づいてフロー分岐を定義するノードタイプです。

IF

ノードの説明

  • 条件文でメッセージをフィルタリングするノードです。

プロパティの説明

プロパティ名 デフォルト値 データ型 説明 備考
条件文 - string メッセージをフィルタリングする条件を入力します。

フィルタリング例 - first depth field reference

条件

  • 条件文 → [logLevel] == "ERROR"

通過メッセージ

{
       "logLevel": "ERROR"
}

漏れメッセージ

{
   "logLevel": "INFO"
}

フィルタリング例 - second depth field reference

条件

  • 条件文 → [response][status] == 200

通過メッセージ

{
    "resposne": {
        "status": 200
    }
}

漏れメッセージ

{
    "resposne": {
        "status": 404
    }
}
目次
TOP