Skip to content

Commit b80d431

Browse files
committed
Merge branch 'main' into sidebar-nav/add-glossary
2 parents dd52d91 + 91e8659 commit b80d431

File tree

14 files changed

+391
-34
lines changed

14 files changed

+391
-34
lines changed

docs/glossary.mdx

Lines changed: 119 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,119 @@
1+
---
2+
tags:
3+
- Community
4+
- Enterprise Standard
5+
- Enterprise Premium
6+
displayed_sidebar: docsEnglish
7+
---
8+
9+
# Glossary
10+
11+
This glossary includes database and distributed-system terms that are often used when using ScalarDB.
12+
13+
## ACID
14+
15+
Atomicity, consistency, isolation, and durability (ACID) is a set of properties that ensure database transactions are processed reliably, maintaining integrity even in cases of errors or system failures.
16+
17+
## concurrency control
18+
19+
Concurrency control in databases ensures that multiple transactions can occur simultaneously without causing data inconsistency, usually through mechanisms like locking or timestamp ordering.
20+
21+
## consensus
22+
23+
Consensus in distributed systems refers to the process of achieving agreement among multiple computers or nodes on a single data value or system state.
24+
25+
## data federation
26+
27+
Data federation is the process of integrating data from different sources without moving the data, creating a unified view for querying and analysis.
28+
29+
## data mesh
30+
31+
A data mesh is a decentralized data architecture that enables each business domain within a company to autonomously manage data and use it efficiently.
32+
33+
## data virtualization
34+
35+
Data virtualization is similar to data federation in many aspects, meaning that it virtualizes multiple data sources into a unified view, simplifying queries without moving the data.
36+
37+
## database anomalies
38+
39+
Database anomalies are inconsistencies or errors in data that can occur when operations such as insertions, updates, or deletions are performed without proper transaction management.
40+
41+
## federation engine
42+
43+
A federation engine facilitates data integration and querying across multiple disparate data sources, often as part of a data federation architecture.
44+
45+
## global transaction
46+
47+
A global transaction spans multiple databases or distributed systems and ensures that all involved systems commit or roll back changes as a single unit.
48+
49+
## heterogeneous databases
50+
51+
Heterogeneous databases refer to systems composed of different database technologies that may have distinct data models, query languages, and transaction mechanisms.
52+
53+
## HTAP
54+
55+
Hybrid transactional/analytical processing (HTAP) refers to a system that can handle both transactional and analytical workloads concurrently on the same data set, removing the need for separate databases.
56+
57+
## JDBC
58+
59+
Java Database Connectivity (JDBC) is an API that allows Java applications to interact with databases, providing methods for querying and updating data in relational databases.
60+
61+
## linearizability
62+
63+
Linearizability is a strong consistency model in distributed systems where operations appear to occur atomically in some order, and each operation takes effect between its start and end.
64+
65+
## NoSQL database
66+
67+
A NoSQL database is a non-relational databases designed for specific data models, such as document, key-value, wide-column, or graph stores, often used for handling large-scale, distributed data.
68+
69+
## Paxos
70+
71+
Paxos is a family of protocols used in distributed systems to achieve consensus, even in the presence of node failures.
72+
73+
## PITR
74+
75+
Point-in-time recovery (PITR) allows a database to be restored to a previous state at any specific time, usually after an unintended event like data corruption.
76+
77+
## polystores
78+
79+
Polystores are database architectures that allow users to interact with multiple, heterogeneous data stores, each optimized for a specific workload or data type, as if they were a single system.
80+
81+
## read-committed isolation
82+
83+
Read-committed isolation is an isolation level where each transaction sees only committed data, preventing dirty reads but allowing non-repeatable reads.
84+
85+
## relational database
86+
87+
A relational database stores data in tables with rows and columns, using a structured query language (SQL) to define, query, and manipulate the data.
88+
89+
## replication
90+
91+
Replication in databases involves copying and distributing data across multiple machines or locations to ensure reliability, availability, and fault tolerance.
92+
93+
## Saga
94+
95+
The Saga pattern is a method for managing long-running transactions in a distributed system, where each operation in the transaction is followed by a compensating action in case of failure.
96+
97+
## serializable isolation
98+
99+
Serializable isolation (serializability) is the highest isolation level in transactional systems, ensuring that the outcome of concurrently executed transactions is the same as if they were executed sequentially.
100+
101+
## snapshot isolation
102+
103+
Snapshot isolation is an isolation level that allows transactions to read a consistent snapshot of the database, protecting them from seeing changes made by other transactions until they complete.
104+
105+
## TCC
106+
107+
Try-Confirm/Cancel (TCC) is a pattern for distributed transactions that splits an operation into three steps, allowing for coordination and recovery across multiple systems.
108+
109+
## transaction
110+
111+
A transaction in databases is a sequence of operations treated as a single logical unit of work, ensuring consistency and integrity, typically conforming to ACID properties.
112+
113+
## transaction manager
114+
115+
A transaction manager coordinates the execution of transactions across multiple systems or databases, ensuring that all steps of the transaction succeed or fail as a unit.
116+
117+
## two-phase commit
118+
119+
Two-phase commit is a protocol for ensuring all participants in a distributed transaction either commit or roll back the transaction, ensuring consistency across systems.

docs/scalardb-benchmarks/README.mdx

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -97,9 +97,9 @@ After applying the schema and configuring the properties file, select a benchmar
9797

9898
### Prepare a benchmarking configuration file
9999

100-
To run a benchmark, you must first prepare a benchmarking configuration file. The configuration file requires at least the locations of the workload modules to run and the database configuration.
100+
To run a benchmark, you must first prepare a benchmarking configuration file. The configuration file requires at least the locations of the workload modules to run and the database configuration.
101101

102-
The following is an example configuration for running the TPC-C benchmark. The ScalarDB properties file specified for `config_file` should be the properties file for the [benchmarking environment that you previously set up](#set-up-your-environment).
102+
The following is an example configuration for running the TPC-C benchmark. The ScalarDB properties file specified for `config_file` should be the properties file that you created as one of the steps in [Load the schema](#load-the-schema).
103103

104104
:::note
105105

Lines changed: 119 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,119 @@
1+
---
2+
tags:
3+
- Community
4+
- Enterprise Standard
5+
- Enterprise Premium
6+
displayed_sidebar: docsJapanese
7+
---
8+
9+
# 用語集
10+
11+
この用語集には、ScalarDB を使用するときによく使用されるデータベースおよび分散システムの用語が含まれています。
12+
13+
## グローバルトランザクション
14+
15+
グローバルトランザクションは複数のデータベースまたは分散システムにまたがり、関係するすべてのシステムが単一のユニットとして変更をコミットまたはロールバックすることを保証します。
16+
17+
## コンセンサス
18+
19+
分散システムにおけるコンセンサスとは、単一のデータ値またはシステム状態について複数のコンピューターまたはノード間で合意を得るプロセスを指します。
20+
21+
## 直列化可能な分離
22+
23+
直列化可能な分離は、トランザクションシステムにおける最高の分離レベルであり、同時に実行されるトランザクションの結果が、順番に実行された場合と同じになることを保証します。
24+
25+
## スナップショット分離
26+
27+
スナップショット分離は、トランザクションがデータベースの一貫したスナップショットを読み取ることを可能にする分離レベルです。これにより、トランザクションが完了するまで、他のトランザクションによる変更が表示されなくなります。
28+
29+
## データフェデレーション
30+
31+
データフェデレーションとは、データを移動せずにさまざまなソースのデータを統合し、クエリと分析のための統一されたビューを作成するプロセスです。
32+
33+
## データメッシュ
34+
35+
データメッシュは、企業内のデータを各ビジネスドメインが自律的に管理し、データを効率的に利活用できるようにする分散型のデータアーキテクチャです。
36+
37+
## データ仮想化
38+
39+
データ仮想化は多くの点でデータフェデレーションに似ています。つまり、複数のデータソースを統一されたビューに仮想化し、データを移動せずにクエリを簡素化します。
40+
41+
## データベース異状
42+
43+
データベース異状とは、挿入、更新、削除などの操作が適切なトランザクション管理なしで実行されたときに発生する可能性があるデータの不整合またはエラーです。
44+
45+
## トランザクション
46+
47+
データベース内のトランザクションは、単一の論理作業単位として扱われる一連の操作であり、一貫性と整合性を確保し、通常は ACID プロパティに準拠します。
48+
49+
## トランザクションマネージャー
50+
51+
トランザクションマネージャーは、複数のシステムまたはデータベースにわたるトランザクションの実行を調整し、トランザクションのすべてのステップが1つの単位として成功または失敗することを保証します。
52+
53+
## フェデレーションエンジン
54+
55+
フェデレーションエンジンは、多くの場合、データフェデレーションアーキテクチャの一部として、複数の異なるデータソース間でのデータ統合とクエリを容易にします。
56+
57+
## ポリストア
58+
59+
ポリストアは、ユーザーが、特定のワークロードまたはデータタイプに合わせて最適化された複数の異種データストアを、あたかも単一のシステムであるかのように操作できるようにするデータベースアーキテクチャです。
60+
61+
## リレーショナルデータベース
62+
63+
リレーショナルデータベースは、行と列を持つテーブルにデータを格納し、構造化クエリ言語 (SQL) を使用してデータを定義、クエリ、および操作します。
64+
65+
## レプリケーション
66+
67+
データベースのレプリケーションでは、信頼性、可用性、およびフォールトトレランスを確保するために、複数のマシンまたは場所にデータをコピーして配布します。
68+
69+
## 線形化可能性
70+
71+
線形化可能性は、分散システムにおける強力な一貫性モデルであり、操作はリアルタイム順序付けと一致する順序でアトミックに発生し、各操作は開始から終了までの間に有効になります。
72+
73+
## 同時実行制御
74+
75+
データベースの同時実行制御は、通常、ロックやタイムスタンプ順序付けなどのメカニズムを通じて、データの不整合を引き起こすことなく複数のトランザクションが同時に発生することを保証します。
76+
77+
## 読み取りコミット分離
78+
79+
読み取りコミット分離は、各トランザクションがコミットされたデータのみを参照する分離レベルです。ダーティリードは防止されますが、反復不可能な読み取りは許可されます。
80+
81+
## 異種データベース
82+
83+
異種データベースとは、異なるデータモデル、クエリ言語、およびトランザクションメカニズムを持つ可能性のある、異なるデータベーステクノロジで構成されたシステムのことです。
84+
85+
## 2フェーズコミット
86+
87+
2フェーズコミットは、分散トランザクションのすべての参加者がトランザクションをコミットまたはロールバックし、システム間の一貫性を保証するためのプロトコルです。
88+
89+
## ACID
90+
91+
原子性、一貫性、独立性、耐久性 (ACID) は、データベーストランザクションが確実に処理され、エラーやシステム障害が発生した場合でも整合性が維持されるようにする一連の特性です。
92+
93+
## HTAP
94+
95+
ハイブリッドトランザクション/分析処理 (HTAP) とは、トランザクションワークロードと分析ワークロードの両方を同じデータセットで同時に処理できるシステムのことです。これにより、個別のデータベースが不要になります。
96+
97+
## JDBC
98+
99+
Java Database Connectivity (JDBC) は、Java アプリケーションがデータベースと対話できるようにする API であり、リレーショナルデータベースでデータをクエリおよび更新するための方法を提供します。
100+
101+
## NoSQL データベース
102+
103+
NoSQL データベースは、ドキュメント、キー値、ワイドカラム、グラフストアなどの特定のデータモデル向けに設計された非リレーショナルデータベースであり、大規模な分散データの処理によく使用されます。
104+
105+
## Paxos
106+
107+
Paxos は、ノード障害が発生した場合でも合意を得るために分散システムで使用されるプロトコルのファミリーです。
108+
109+
## PITR
110+
111+
ポイントインタイムリカバリ (PITR) を使用すると、通常はデータ破損などの意図しないイベントが発生した後に、データベースを特定の時間に以前の状態に復元できます。
112+
113+
## Saga
114+
115+
Saga パターンは、分散システムで長時間実行されるトランザクションを管理する方法です。トランザクション内の各操作の後に、障害が発生した場合の補償アクションが続きます。
116+
117+
## TCC
118+
119+
Try-Confirm/Cancel (TCC) は、操作を3つのステップに分割し、複数のシステム間での調整と回復を可能にする分散トランザクションのパターンです。

i18n/versioned_docs/ja-jp/docusaurus-plugin-content-docs/current/scalardb-benchmarks/README.mdx

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -32,7 +32,7 @@ import TranslationBanner from '/src/components/_translation-ja-jp.mdx';
3232
- Kelpie は、システムのベンチマークや検証などのエンドツーエンドのテストを実行するためのフレームワークです。 [Kelpie Releases](https://github.com/scalar-labs/kelpie) から最新バージョンを入手し、アーカイブファイルを解凍します。
3333
- ベンチマークツールを実行するクライアント
3434
- ターゲットデータベース
35-
- ScalarDB がサポートするデータベースの一覧については、[Supported Databases](../scalardb-supported-databases.mdx) を参照してください。
35+
- ScalarDB がサポートするデータベースの一覧については、[Databases](../requirements.mdx#データベース) を参照してください。
3636

3737
:::note
3838

@@ -102,7 +102,7 @@ cd scalardb-benchmarks
102102

103103
ベンチマークを実行するには、まずベンチマーク設定ファイルを準備する必要があります。設定ファイルには、少なくとも実行するワークロードモジュールの場所とデータベース設定が必要です。
104104

105-
以下は、TPC-C ベンチマークを実行するための設定例です。`config_file` に指定する ScalarDB プロパティファイルは、[以前に設定したベンチマーク環境](#ベンチマーク-ツールをセットアップする)のプロパティファイルである必要があります
105+
以下は、TPC-C ベンチマークを実行するための設定例です。`config_file` に指定する ScalarDB プロパティファイルは、[スキーマをロードする](#スキーマをロードする)の手順の1つとして設定したプロパティファイルである必要があります
106106

107107
:::note
108108

0 commit comments

Comments
 (0)