シーセンス用語のご紹介

26 Jul 2017 | By CXENSE Japan

テクノロジーの仕事をしていると、よく知らない言葉に遭遇する可能性が高くなります。シーセンスも御多分に洩れず、横文字だらけです。そこで、このブログでは、シーセンスの専門用語について解説します。シーセンス特有のものも、そうでないものも含まれています。

シーセンスのソリューションセット

シーセンスだけで独自の言語となり得るくらい、幅広いソリューションセットがあります。そこで、それぞれのソリューションセットが意味するものを定義し、掘り下げて説明します。シーセンスは詳細なデータ収集とリアルタイムの実行を核とする幅広いソリューションを開発しており、メディアやパブリッシャー、eコマースが抱える複雑な課題を解決します。シーセンスはまた、チャレンジ精神も旺盛なため、お客様の課題を解決できるよう製品開発をしています:

データマネジメントとインサイト

リアルタイム分析のダッシュボードやセグメンテーションなどを含む、詳細なオーディエンスマネジメントと理解を可能にするシーセンスで利用可能な機能。このシーセンスソリューションで利用する可能性がある製品:Cxense Insight、Cxense DMP

パーソナライゼーション

個人、個人のレベルで各エンドユーザーへパーソナライズされたコンテンツを提供するためのデータ活用を可能にする、シーセンスで利用可能な機能。このシーセンスソリューションで利用する可能性がある製品:Cxense Content、Cxense DMP、Cxense Video

コンバージョンの最適化

eメールのサブスクリプション、サブスクリプションの提案、アドブロッキングなど、様々なタイプのキャンペーンでコンバージョンを可能にするシーセンスの機能。このシーセンスソリューションを構成する製品:Cxense Content、Cxense Display、Cxense DMP

シーセンス用語辞書

ここまでシーセンスがどのようなソリューションをお客様へ提供するかご説明したので、これらのソリューションセットで利用される一つひとつの用語(概念、原則、機能)をご紹介します。

1st、2nd、3rdパーティデータ

1stパーティデータは、Webサイトやアプリ、有料広告、レスポンスデータ、CRMデータなど、あらゆる貴社のオンラインとオフラインから収集、作成されたデータです。2ndパーティデータは提携先サイトやパートナー、3rdパーティから一定下の条件で提供されたデータです。差別化を生み、収益を促すデータは、貴社独自の1stパーティデータが作り上げます。

API

API(Application Programming Interface)は、アプリケーション間のやり取りに関する特定の仕様です。シーセンスは最初からお客様がシーセンス単体で利用することはないと考えていたため、アクセス可能なAPIベースの技術を構築することは不可欠でした。そのため、シーセンスでは統合できるようにオープンなインフラを整備しています。これは、シーセンスのUI内でアクセス可能な全てのものは、API経由でもアクセス可能であることを意味します。

コンテンツプロファイル

シーセンスのスクリプトが挿入されたページごとにコンテンツプロファイルが生成されます。シーセンスのスクリプトが貴社ページへ挿入されると、シーセンスのWebロボットが定期的にページをクロールします。クロールされたページが解析されると、各ページから抽出されたテキストが意味解析や要約されて、自然言語処理と辞書を利用してコンテンツプロファイルが生成されます。コンテンツプロファイルはページのトピックとテーマを伝えます。コンテツプロファイルはまた、トリプルセットとして捉えることもできます。

  • アイテム:何らかの興味を持っている、何らかの種類の文字列。多くの場合、ページ上に実際に記載されているものを正規化したものですが、カテゴリ名などの場合もあります。
  • ウェイト:検索情報から明確にされた概念によって測定された、ページ上のアイテムの相対的な重要度を何らかの形で反映した数値。
  • グループ名:何らかの形で項目の種類を示す文字列。通常、項目をセマンティックに解釈する方法を特定します。例として、‘john smith’という項目はグループ名が‘person’で、人名であることを示します。

クッキー(Cookie)

クッキーは、利用されているマシンのブラウザが持っている小さなテキストファイルです。サイト訪問ごとに、1つ、もしくは複数のクッキーがある可能性があります。クッキーの目的は貴社や貴社のサイトにユーザーが訪問履歴を残す方法を付与し、次にサイトへ戻った時にアクセスできるようにすることです。シーセンスはこれらの機能を利用して、お客様のサイトでユーザーのトラッキングや関連付けをしてユーザープロファイルを作成します。(ユーザープロファイルについては下記の別記載を参照)しかし、全てのクッキーが等しく作成されるわけではありません。そのため、シーセンスはユーザートラッキングのためのクッキーの設定に関して、複数の方法を採用しています。

シーセンスのスクリプトは最初に1stパーティクッキーを設定します。これは常に動作します。そうでなければ、インターネットは機能しません。1stパーティクッキーは同じサイトやドメインを訪問したユーザーをリピート来訪者として認識させることができます。3rdパーティクッキーで広告をブロックする場合は、シーセンスは次の方法でクロスサイトのトラッキングを実行することができます。

  1. 最初に3rdパーティクッキーを設定します。
  2. 次にローカルストレージに書き込みます。
  3. 最後にスクリプトをキャッシュします。

シーセンスクローラー

コンテンツ取得プロセス自動化の一環として、貴社サイトへシーセンスのWebロボットやクローラーが訪問することがあります。Webロボットはシーセンスのスクリプトが設置されているページのみを読み込みます。ページはURLによって認識されます。最新のコンテンツが認識されるように、ページは定期的に再クロールされます。新しいページは処理可能であれば即座に読み込まれます。ただし、現在は新しいページがクロールされる前に、少なくとも3回(約6時間以内で)閲覧されている必要があります。

カスタマーキューブ

シーセンスをご利用されているお客様ごとに、隔離されたカスタマーキューブへデータが格納されています。これは、リアルタイムでIDマッピング、コンテンツプロファイル、ユーザープロファイル、イベントプロファイルのような情報を格納する、社内開発されたカスタムデータベースです。キューブに格納されるイベントは、通常10ミリ秒以内で検索可能です。カスタマーキューブは、データストレージ、データ計算、履歴データのリアルタイム処理における効率化を実現します。さらに、データの冗長性を削減し、データ漏えいを防止します。

シーセンスのスクリプト(cx.js)

Webサイトの<head>部分に含まれているJavaScriptスニペットで、お客様のサイトのトラッキングを分析することができます。ページに配置されたJavaScriptスニペットは、実際にはcx.jsと言う名前の“本当の”スクリプトをコールするためのラッパーです。

  • cx.jsスクリプトはクライアントによって非同期にロードされるため、クライアントが気になるパフォーマンス上の悪影響はありません。
  • cx.jsスクリプトは、世界中で最もトラフィックの多いページの一部を強化していて、2010年から継続的にアプローチを最適化しています。
  • cx.jsスクリプトは常にブラウザのキャッシュ(ネットワークトラフィック無し)から提供され、定期的に更新リクエストが送信されますが、コンテンツは転送されません(HTML code 304 “Not Modified”)。これは、少なくともモバイルブラウザのネットワークトラフィックにとって欠かせません。
  • cx.jsスクリプトは匿名ユーザーを管理するために1stパーティクッキーと3rdパーティクッキーを設置し、シーセンスプラットフォームはどのページが閲覧されたかだけでなく、誰が閲覧したかまでわかるようにします。

ファネル

コンバージョンのためにトラッキングされるユーザーの一連のステップをファネルと言います。ファネルの一般的なステップは、終わりに近づくにつれて細くなります。これは、Cxense DMPのファネル機能を利用して構築できます。

IDシンク

多くのお客様は自社ユーザーID(会員ID等)とシーセンスによって生成されたユーザープロファイル(ブラウザの1stパーティクッキー)を揃えたいと考えています。お客様はページへ挿入したシーセンスのスクリプトに含まれるコードでこれを実現することができます。シーセンスのスクリプトが実行されると、ユーザープロファイル(1stパーティクッキー)とお客様の IDが紐付けられます。

インディビュアリゼーション

シーセンスのソリューションセットが提供するパーソナライゼーションアプローチと戦略を指します。リアルタイムで実行可能な最も詳細なレベルでデータポイントが収集されることを意味します。

LTS (Long Term Storage)

シーセンスはリアルタイムで実行される堅牢なデータを提供しているため、イベントデータを31日間保存することは理にかなっています。31日間以上イベントデータを保存したい場合は、お客様の要件に従いサイト毎にLTS (Long Term Storage)を契約できます。

ノイズリダクション

特にパブリッシャー向けにシーセンスのパーソナライゼーションを利用する利点の一つです。エンドユーザーがお客様のページにアクセスしていると考えると、シーセンスはエンドユーザーがまだ見たことのないコンテンツを提供します。これは、ホームページにある特集セクションの膨大な量のコンテンツが、エンドユーザーへより多く届けられることを意味します。エンドユーザーには、訪れるコンテンツのオプションが豊富に用意されています。つまり、パブリッシャーは既に投資している高コンバージョンを稼ぎ出す普遍的なコンテンツをより多く表示できるため、コンバージョン率が向上します。

最適化

A/Bテストとも知られる最適化は、幅広いユーザーへ最適なプレゼンテーションを決定します。一般的には現状版と試したいアプローチを利用して、勝者が決まるまで一定期間にわたってオーディエンスに向けて候補を入れ替えて最適化していきます。コンテンツをカスタマイズさせる優れたアプローチですが、シーセンスはこれを本当のパーソナライゼーションとは考えていません。

パーソナライゼーション

個人個人のレベルでコンテンツをカスタマイズします。レコメンドソリューションからパーソナライゼーションソリューションへの大きな飛躍は、ブラウザで各ユーザーの行動からデータを収集することです。シーセンスはこの取り組みに焦点を当てました:これにより、データを収集し、リアルタイムの1対1パーソナライゼーションの実行を可能にします。

ピクセルトラッキング(別名ピクセルリクエスト、Webビーコン)

クロスドメインエラーを避けるために、シーセンスで生成されたユーザートラッキングと分析に関するデータは、レポート情報用に1x1ピクセルに添付されています。

プレースメント

プレースメントやウィジェットはシーセンスで入れ替えて使われ、一度に様々なタイプのユーザーをターゲティングするリアルタイプのパーソナライゼーションアルゴリズムによってコンテンツのセクションを参照します。例えば、プレースメントはチェックアウト時に商品概要の下にあるべきセクションで、他のアイテムの購入をレコメンドします。これらは数クリックでシーセンスのコンテンツウィジェットを利用して作成することも、シーセンスの APIを利用して作成することも可能で、ページ全体を強化できます。

製品の表示

デジタルの小売店は、お客様のエンドユーザーにとって店内でのエクスペリエンスバージョンのため、エンドユーザーへの製品の表示はWebサイトの特定のセクションで目にしたアイテムの数になります。シーセンスを利用すると、エンドユーザーが見たことのないアイテムだけをホームページに表示する“What’s New”のパーソナライゼーションされたプレースメントを作成することができ、製品の表示数や購入の可能性を高めることができます。

リアルタイム

リアルタイムで収集されたデータに対してリアルタイムで実行することは、シーセンスのデータフィソロジーの中核です。シーセンスでは、リアルタイムはバッチ処理を意味しません。これは、Cxense Insight内のすべてのユーザーインタラクションが2秒以内に表示されることを意味します。同様にDMPセグメントが2秒以内に更新されることを意味します。シーセンスのクローラーからのページのプロファイリング要求が60秒未満で発生することを意味します。シーセンスは1秒間に数万件のイベントを受信し、お客様のキューブにフィードしたイベントは通常10ミリ秒未満で検索可能です。

レコメンデーション

最適化と密接な関係にあるレコメンデーションソリューションは一つひとつのコンテンツに同じアプローチを適用します。極めて一般的には、コラボレーションフィルタリングと呼ばれる手法をベースに構築されていますが、ほとんどのレコメンデーションエンジンは一般的なコンテンツもしくはクリックされる可能性が高いコンテンツを条件として、類似したオーディエンスのセットを比較します。これはコンテンツをカスタマイズするための優れたアプローチですが、シーセンスはこれを本当のパーソナライゼーションと考えていません。

サーチインデックス

シーセンスのクローラーによって取り込まれた一つひとつのWebページは、お客様のサーチインデックスの一部として保存されます。Cxense SearchのAPIを通じてアクセスし、リッチで関連性の高いサーチエクスペリエンスを作り上げます。

意味解析(セマンティック解析)

シーセンスクローラーはページを解析する際に、パージングヒューリスティックを利用してページから不要なデータを取り除きますが、マシンラーニングと言語モデルを利用して構造化されたデータ、構造化されていないデータ双方から意味を導き出します。一旦完了すると、意味解析では、カテゴリ、コンセプト、エンティティ、場所や関連キーワードを関連付けて、製品ランダーや記事であるかどうかについて、コンテンツが何であるかを作成します。

ユーザープロファイル

シーセンスプラットフォームはユニークユーザー毎のユーザープロファイルを保持し、ユーザープロファイルはユーザーがサイトを訪れた際に更新されます。このような更新はリアルタイム、もしくは定期的な更新で行われます。ユーザープロファイルは4つの主なソースから発生するデータで構成されています。

  1. ユーザーが消費するページがコンテンツプロファイルです。例えば、ユーザーがテクノロジーに関するページを閲覧する傾向がある場合、該当ユーザーのプロファイルに反映されます。
  2. ユーザーの検索クエリ。
  3. ユーザーが行なったリクエストから推測されるデータを指します。例えば、IPアドレスとユーザーエージェントから、ユーザーの場所とデバイスの利用状況について多くのことを推測できます。
  4. 外部から提供されるユーザーデータ。これはシーセンスと共有している何らかの形でお客様について把握している非公開データです。

ウィジェット

ウィジェットやプレースメントは、シーセンスとやり取りできるようにされており、リアルタイムのパーソナライゼーションアルゴリズムによって強化されたコンテンツのセクションを指し、一度で様々なタイプのユーザーを対象にしています。例えば、ウィジェットは現在の記事に関連性があり、ユーザーが見たことのない他の記事を提示する、記事の右側に配置されるセクションでもいいでしょう。これらは、Cxense Contentのウィザードを利用してほんの数回のクリックで作成することもできますし、APIを利用してページ全体をウィジェットで作ることもできます。

シーセンスの日々の辞書には、クッキー、ファネル、クローラーが入っています。シーセンスの用語の多くは、データとテクノロジーへフォーカスしています。これらの各用語は、人々が欲するものを提供するシーセンスのビジョンと戦略全体の核となる要素です。そのため、自信を持って「シーセンス用語」を世界中へ発信していきます。