Google Code が利用できる言語: English - Español - 日本語 - 한국어 - Português - Pусский - 中文(简体) - 中文(繁體)
Google App Engine データストアは、強固でスケーラブルな Web アプリケーション用ストレージを提供します。データストアは Web アプリケーションでの使用を前提として設計されており、特に読み取りおよびクエリのパフォーマンス向上に重点を置いています。データストアには、アプリケーションの定義に従って整理されたデータ エンティティとプロパティが格納されます。同じ種類のエンティティをまたがるようなクエリを実行できます。また、プロパティ値とキーでフィルタを適用し、並び替えることもできます。大量のデータ セットから高速にデータを取得するために、すべてのクエリには事前にインデックスが定義されています。データストアでは、アプリケーションが定義したエンティティ グループを分散データ ネットワークのトランザクション単位として使用するトランザクション更新をサポートしています。
App Engine のデータストアは、「エンティティ」と呼ばれるデータ オブジェクトに対するクエリを格納し、実行します。エンティティには 1 つ以上の「プロパティ」(サポートされるデータ型の、名前の付いた値)が含まれます。プロパティは別のエンティティへの参照とすることもできます。
データストアは 1 回のトランザクションで複数のオペレーションを実行することができ、いずれかのオペレーションが失敗したときにはトランザクション全体をロールバックできます。これは、複数のユーザーがアクセスしたり同じデータ オブジェクトを同時に操作したりする可能性のある、分散された Web アプリケーションで特に便利です。
従来のデータベースとは異なり、データストアは分散型アーキテクチャを使用して、非常に大きなデータ セットのスケーリングを管理します。App Engine アプリケーションは、データ オブジェクト間の関係性を記述し、クエリのインデックスを定義することでデータの分散方法を最適化することができます。
App Engine データストアは、強い一貫性を持ちますが、リレーショナル データベースではありません。データストアのインターフェースには従来のデータベースと同じ機能が多くありますが、データストアには独自の特性があり、自動スケーリングの機能を活用した、データ設計と管理の新しい方法の可能性を秘めています。
データストア エンティティにはスキーマがありません。同じ種類の 2 つのエンティティは、同じプロパティを持ったり、同じプロパティに同じ値タイプを持ったりする必要はありません。必要に応じてエンティティがスキーマを構成するよう、アプリケーションが制御する必要があります。そのために、Python SDK にはスキーマを簡単に適用するためのデータ モデリング機能を含んだ豊富なライブラリが含まれています。
Python API では、モデルはプロパティの種類と設定を含むエンティティの種類を記述します。アプリケーションは Python クラスを使用して、プロパティを記述するクラス属性でモデルを定義します。ある種類のエンティティは対応するモデル クラスのインスタンスで表され、インスタンス属性はプロパティ値を表します。エンティティは、クラスのコンストラクタを呼び出して作成し、put() メソッドを呼び出して格納します。
import datetime
from google.appengine.ext import db
from google.appengine.api import users
class Employee(db.Model):
name = db.StringProperty(required=True)
role = db.StringProperty(required=True, choices=set(["executive", "manager", "producer"]))
hire_date = db.DateProperty()
new_hire_training_completed = db.BooleanProperty()
account = db.UserProperty()
e = Employee(name="",
role="manager",
account=users.get_current_user())
e.hire_date = datetime.datetime.now()
e.put()
Datastore API はクエリ用に 2 つのインターフェースを提供します。 クエリ オブジェクト インターフェースと、SQL に似たクエリ言語である GQL です。クエリは修正可能でデータストアに再格納できる、モデル クラスのインスタンスの形式でエンティティを返します。
training_registration_list = [users.User("Alfred.Smith@example.com"),
users.User("jharrison@example.com"),
users.User("budnelson@example.com")]
employees_trained = db.GqlQuery("SELECT * FROM Employee WHERE account IN :1",
training_registration_list)
for e in employees_trained:
e.new_hire_training_completed = True
db.put(e)
App Engine データストア内のデータ オブジェクトを「エンティティ」といいます。エンティティには 1 つ以上の「プロパティ」があります。プロパティとは、名前のついた値であり、そのデータ型には整数、浮動小数点値、文字列、日付、バイナリ データなどを指定できます。
エンティティには各自を一意に識別する「キー」も含まれます。最も単純なキーには、「種類」とデータストアが指定した一意の数値 ID があります。ID はアプリケーションが指定した文字列の場合もあります。
アプリケーションがデータストアからエンティティをフェッチする場合は、そのエンティティのキーを使用するか、そのエンティティのプロパティに適合するクエリを実行します。クエリは 0 以上のエンティティを返します。クエリの結果はプロパティ値によって並び替えることができます。クエリでは、メモリと実行時間を節約するため、データストアが返す結果の数を制限することもできます。
リレーショナル データベースとは違い、App Engine データストアでは、指定された種類のすべてのエンティティが同じプロパティを持っている必要はありません。SDK に含まれているライブラリ、または独自のコードを使用してアプリケーションからデータ モデルを定義し、適用できます。
プロパティには 1 つ以上の値を割り当てることができます。複数の値を持つプロパティには、さまざまなデータ型の値を指定できます。複数の値を持つプロパティへのクエリでは、いずれかの値がクエリの条件を満たすかどうかを確認します。そのため、複数の値を持つプロパティはメンバーシップの確認において有効です。
App Engine データストア クエリは指定された種類(データ クラス)のすべてのエンティティで動作します。エンティティ プロパティ値とキーに対して、0 個以上のフィルタと 0 個以上の並び替え順序を指定できます。クエリのフィルタや並び替え順に指定されているすべてのプロパティに対し、エンティティに少なくとも 1 つの値(null 値の場合もある)が割り当てられており、また、すべてのフィルタ条件がプロパティ値を満たす場合、クエリの結果としてエンティティが返されます。
すべてのデータストア クエリはインデックスを使用します。インデックスは、希望する順に並べられたクエリ結果を含むテーブルです。App Engine アプリケーションは、設定ファイルでインデックスを定義します。開発用 Web サーバーは、インデックスが設定されていないクエリが発生すると、このファイルに自動的に候補を追加します。アプリケーションをアップロードする前に、手動でファイルを編集して、インデックスを調整できます。アプリケーションがデータストア エンティティに変更を加えると、データストアは正しい結果でインデックスを更新します。アプリケーションがクエリを実行すると、データストアは対応するインデックスから直接結果をフェッチします。
このメカニズムは広範囲のクエリをサポートしており、ほとんどのアプリケーションに適しています。しかし、他のデータベース技術の慣れ親しんだクエリの中には対応していないものもあります。
App Engine データストアでは、エンティティの作成、更新、削除のすべての操作は「トランザクション」で実行されます。トランザクションは、エンティティへのすべての変更が確実にデータストアに保存されるよう処理します。トランザクションが失敗した場合、変更は適用されません。これにより、エンティティ内のデータの一貫性が保証されます。
トランザクション API を使用し、1 つのトランザクションで複数のアクションをエンティティに適用できます。たとえば、オブジェクトのカウンタ フィールドの値を増やす場合を考えてみましょう。カウンタを増やすには、カウンタの値を読み取り、新しい値を算出し格納します。トランザクションを使用しない場合、値を読み取ってから更新するまでの間に、別のプロセスがカウンタを増やしてしまい、アプリケーションがその更新された値を上書きしてしまうケースが発生する可能性があります。読み取り、計算、書き込みを 1 つのトランザクションで実行することで、他のプロセスの影響を受けずに値を増やすことができます。
1 つのトランザクションで複数のエンティティを変更できます。この機能を実行するには、同時に更新できるエンティティがどれであるかを App Engine が事前に知っている必要があります。これにより、トランザクションをサポートする形式でエンティティを保存できます。エンティティの作成時に、他のエンティティと同じ「エンティティ グループ」に属していることを宣言する必要があります。1 つのトランザクションからフェッチ、作成、更新、削除を実行するすべてのエンティティは、同じエンティティ グループに属している必要があります。
エンティティ グループでは、エンティティ間の関係を階層構造で定義します。グループにエンティティを作成するには、そのグループに属するエンティティの「子」として定義します。もう一方のエンティティは「親」となります。親を持たずに作成されたエンティティは、「ルート」 エンティティとなります。子のないルート エンティティは、そのエンティティ グループに属する唯一のエンティティとなります。各エンティティには、ルート エンティティから自分自身への親子関係のパスが存在します(最短のパスは親のないエンティティです)。このパスは、エンティティの完全キーの基本となる部分です。完全キーは、パス内の各エンティティの種類および ID またはキー名で表されます。
データストアではトランザクションの管理に「オプティミスティック コンカレンシ」を使用しています。アプリケーション インスタンスがエンティティ グループ内のエンティティへの変更を適用中は、グループ内のすべてのエンティティへの他の更新はすぐにエラーとなります。アプリケーションは更新されたデータに対してトランザクションを再実行できます。
データストア API への各コールはデータストア API コールの割り当てとして数えられます。ライブラリ コールによっては、基本となるデータストア API への複数のコールとなることにご注意ください。
アプリケーションからデータストアに送られたデータは、(データストアに)送信されたデータの API の割り当てとして数えられます。アプリケーションがデータストアから受け取るデータは、(データストアから)受信したデータの API の割り当てとして数えられます。
アプリケーションが使用するために現在データストアに格納されているデータの合計は保存されているデータ(調整可能)の割り当てを超えることはできません。これにはエンティティ プロパティとキーは含まれますが、インデックスは含まれません。
データストア処理で使用された CPU 時間は、次の割り当てに含まれます。
割り当ての詳細については、割り当て、および管理コンソールの「割り当て詳細」セクションをご覧ください。
割り当てに加え、データストアの使用には次の制限があります。
| 制限 | 制限値 |
|---|---|
| 最大エンティティ サイズ | 1 MB |
| エンティティのインデックス値の最大数 |
1、000 個 |
| バッチ put または delete の最大エンティティ数 | 500 エンティティ |
| バッチ get の最大エンティティ数 | 1,000 エンティティ |
| クエリの最大結果オフセット | 1,000 |
|
|