DTStack
diff --git a/‎README.md‎
Lines changed: 103 additions & 13 deletions b/‎README.md‎
Lines changed: 103 additions & 13 deletions
diff --git a/‎docs/elasticsearchSink.md‎ b/‎docs/elasticsearchSink.md‎
diff --git a/‎docs/hbaseSide.md‎
Lines changed: 65 additions & 0 deletions b/‎docs/hbaseSide.md‎
Lines changed: 65 additions & 0 deletions
diff --git a/‎docs/hbaseSink.md‎ b/‎docs/hbaseSink.md‎
diff --git a/‎docs/kafka09source.md‎
Lines changed: 35 additions & 0 deletions b/‎docs/kafka09source.md‎
Lines changed: 35 additions & 0 deletions
diff --git a/‎docs/mysqlSide.md‎ b/‎docs/mysqlSide.md‎
diff --git a/‎docs/mysqlSink.md‎ b/‎docs/mysqlSink.md‎
@@ -1,8 +1,8 @@
 # flinkStreamSQL
 > * 基于开源的flink，对其实时sql进行扩展   
->  > 自定义create table 语法（包括输入源表,输出表,维表）
->  > 自定义create function 语法
->  > 实现了流与维表的join
+>  >  * 自定义create table 语法（包括源表,输出表,维表）
+>  >  * 自定义create function 语法
+>  >  * 实现了流与维表的join
 
 
 ## 1 快速起步
@@ -72,15 +72,15 @@ mvn clean package -Dmaven.test.skip
     * 必选：否
     * 默认值：无
     * 可选参数:
-        sql.env.parallelism: 默认并行度设置
-        sql.max.env.parallelism: 最大并行度设置
-        time.characteristic: 可选值[ProcessingTime|IngestionTime|EventTime]
-        sql.checkpoint.interval: 设置了该参数表明开启checkpoint(ms)
-        sql.checkpoint.mode: 可选值[EXACTLY_ONCE|AT_LEAST_ONCE]
-        sql.checkpoint.timeout: 生成checkpoint的超时时间(ms)
-        sql.max.concurrent.checkpoints: 最大并发生成checkpoint数
-        sql.checkpoint.cleanup.mode: 默认是不会将checkpoint存储到外部存储,[true(任务cancel之后会删除外部存储)|false(外部存储需要手动删除)]
-        flinkCheckpointDataURI: 设置checkpoint的外部存储路径,根据实际的需求设定文件路径,hdfs://, file://
+        * sql.env.parallelism: 默认并行度设置
+        * sql.max.env.parallelism: 最大并行度设置
+        * time.characteristic: 可选值[ProcessingTime|IngestionTime|EventTime]
+        * sql.checkpoint.interval: 设置了该参数表明开启checkpoint(ms)
+        * sql.checkpoint.mode: 可选值[EXACTLY_ONCE|AT_LEAST_ONCE]
+        * sql.checkpoint.timeout: 生成checkpoint的超时时间(ms)
+        * sql.max.concurrent.checkpoints: 最大并发生成checkpoint数
+        * sql.checkpoint.cleanup.mode: 默认是不会将checkpoint存储到外部存储,[true(任务cancel之后会删除外部存储)|false(外部存储需要手动删除)]
+        * flinkCheckpointDataURI: 设置checkpoint的外部存储路径,根据实际的需求设定文件路径,hdfs://, file://
 
 
 * **flinkconf**
@@ -91,4 +91,94 @@ mvn clean package -Dmaven.test.skip
 * **yarnconf**
 	* 描述：Hadoop配置文件（包括hdfs和yarn）所在的目录（单机模式下不需要），如/hadoop/etc/hadoop
 	* 必选：否
-	* 默认值：无
+	* 默认值：无
+
+## 2 结构
+### 2.1 源表插件
+* [kafka09 源表插件](docs/kafka09Source.md)
+
+### 2.2 结果表插件
+* [elasticsearch 结果表插件](docs/elasticsearchSink.md)
+* [hbase 结果表插件](docs/hbaseSink.md)
+* [mysql 结果表插件](docs/mysqlSink.md)
+
+### 2.3 维表插件
+* [hbase 维表插件](docs/hbaseSide.md)
+* [mysql 维表插件](docs/mysqlSide.md)
+	
+## 3 样例
+
+```
+CREATE TABLE MyTable(
+    name string,
+    channel STRING,
+    pv INT,
+    xctime bigint,
+    CHARACTER_LENGTH(channel) AS timeLeng
+ )WITH(
+    type ='kafka09',
+    bootstrapServers ='172.16.8.198:9092',
+    zookeeperQuorum ='172.16.8.198:2181/kafka',
+    offsetReset ='latest',
+    topic ='nbTest1',
+    parallelism ='1'
+ );
+
+CREATE TABLE MyResult(
+    channel VARCHAR,
+    pv VARCHAR
+ )WITH(
+    type ='mysql',
+    url ='jdbc:mysql://172.16.8.104:3306/test?charset=utf8',
+    userName ='dtstack',
+    password ='abc123',
+    tableName ='pv2',
+    parallelism ='1'
+ );
+
+CREATE TABLE workerinfo(
+    cast(logtime as TIMESTAMP)AS rtime,
+    cast(logtime)AS rtime
+ )WITH(
+    type ='hbase',
+    zookeeperQuorum ='rdos1:2181',
+    tableName ='workerinfo',
+    rowKey ='ce,de',
+    parallelism ='1',
+    zookeeperParent ='/hbase'
+ );
+
+CREATE TABLE sideTable(
+    cf:name String as name,
+    cf:info String as info,
+    PRIMARY KEY(name),
+    PERIOD FOR SYSTEM_TIME
+ )WITH(
+    type ='hbase',
+    zookeeperQuorum ='rdos1:2181',
+    zookeeperParent ='/hbase',
+    tableName ='workerinfo',
+    cache ='LRU',
+    cacheSize ='10000',
+    cacheTTLMs ='60000',
+    parallelism ='1'
+ );
+
+insert
+into
+    MyResult
+    select
+        d.channel,
+        d.info
+    from
+        (      select
+            a.*,b.info
+        from
+            MyTable a
+        join
+            sideTable b
+                on a.channel=b.name
+        where
+            a.channel = 'xc2'
+            and a.pv=10      ) as d
+```
@@ -0,0 +1,65 @@
+
+## 1.格式：
+```
+ CREATE TABLE tableName(
+     columnFamily:columnName type as alias,
+     ...
+     PRIMARY KEY(keyInfo),
+     PERIOD FOR SYSTEM_TIME
+  )WITH(
+     type ='hbase',
+     zookeeperQuorum ='ip:port',
+     zookeeperParent ='/hbase',
+     tableName ='tableNamae',
+     cache ='LRU',
+     cacheSize ='10000',
+     cacheTTLMs ='60000',
+     parallelism ='1',
+     partitionedJoin='false'
+  );
+```
+  
+## 2.参数
+
+* tableName ==> 注册到flink的表名称(可选填;不填默认和hbase对应的表名称相同)
+* columnFamily:columnName ==> hbase中的列族名称和列名称
+* alias ===> hbase 中的列对应到flink中注册的列名称
+* PERIOD FOR SYSTEM_TIME ==> 关键字表明该定义的表为维表信息
+* PRIMARY KEY(keyInfo) ==> 维表主键定义;hbase 维表为rowkey的构造方式;
+                         可选择的构造包括 md5(alias + alias), '常量',也包括上述方式的自由组合
+
+* type ==> 表明维表的类型[hbase|mysql]
+* zookeeperQuorum ==> hbase 的zk地址;格式ip:port[;ip:port]
+* zookeeperParent ==> hbase 的zk parent路径
+* tableName ==> hbase 的表名称
+* cache ==> 维表缓存策略(NONE/LRU)
+
+    > * NONE: 不做内存缓存
+    > * LRU:
+    > > cacheSize ==> 缓存的条目数量
+    > > cacheTTLMs ==> 缓存的过期时间(ms)
+
+* partitionedJoin ==> 是否在維表join之前先根据 設定的key 做一次keyby操作(可以減少维表的数据缓存量)
+
+## 3.样例
+```
+CREATE TABLE sideTable(
+    cf:name String as name,
+    cf:info int as info,
+    PRIMARY KEY(md5(name) + 'test'),
+    PERIOD FOR SYSTEM_TIME
+ )WITH(
+    type ='hbase',
+    zookeeperQuorum ='rdos1:2181',
+    zookeeperParent ='/hbase',
+    tableName ='workerinfo',
+    cache ='LRU',
+    cacheSize ='10000',
+    cacheTTLMs ='60000',
+    parallelism ='1',
+    partitionedJoin='true'
+ );
+
+```
+
+
@@ -0,0 +1,35 @@
+## 1.格式：
+```
+CREATE TABLE tableName(
+    colName colType,
+    ...
+    function(channel) AS alias
+ )WITH(
+    type ='kafka09',
+    bootstrapServers ='ip:port,ip:port...',
+    zookeeperQuorum ='ip:port,ip:port/zkparent',
+    offsetReset ='latest',
+    topic ='nbTest1',
+    parallelism ='1'
+ );
+```
+## 2.参数：
+  * type ==> kafka09
+  * bootstrapServers
+## 3.样例：
+```
+CREATE TABLE MyTable(
+    name string,
+    channel STRING,
+    pv INT,
+    xctime bigint,
+    CHARACTER_LENGTH(channel) AS timeLeng
+ )WITH(
+    type ='kafka09',
+    bootstrapServers ='172.16.8.198:9092',
+    zookeeperQuorum ='172.16.8.198:2181/kafka',
+    offsetReset ='latest',
+    topic ='nbTest1',
+    parallelism ='1'
+ );
+```