re-run example

JohnMount · JohnMount · commit 231b05f1ea76 · 2019-09-15T09:29:58.000-07:00
diff --git a/Examples/LogisticExample/BuildDiagram.md b/Examples/LogisticExample/BuildDiagram.md
@@ -12,29 +12,32 @@ r_ops <- convert_yaml_to_pipeline(r_yaml)
 cat(format(r_ops))
 ```
 
-    ## table(d; 
-    ##   subjectID,
-    ##   surveyCategory,
-    ##   assessmentTotal,
-    ##   irrelevantCol1,
-    ##   irrelevantCol2) %.>%
+    ## mk_td("d", c(
+    ##   "subjectID",
+    ##   "surveyCategory",
+    ##   "assessmentTotal",
+    ##   "irrelevantCol1",
+    ##   "irrelevantCol2")) %.>%
     ##  extend(.,
     ##   probability %:=% exp(assessmentTotal * 0.237)) %.>%
     ##  extend(.,
     ##   total %:=% sum(probability),
-    ##   p= subjectID) %.>%
+    ##   partitionby = c('subjectID'),
+    ##   orderby = c(),
+    ##   reverse = c()) %.>%
     ##  extend(.,
     ##   probability %:=% probability / total) %.>%
     ##  extend(.,
     ##   sort_key %:=% -(probability)) %.>%
     ##  extend(.,
     ##   row_number %:=% row_number(),
-    ##   p= subjectID,
-    ##   o= "sort_key") %.>%
+    ##   partitionby = c('subjectID'),
+    ##   orderby = c('sort_key'),
+    ##   reverse = c()) %.>%
     ##  select_rows(.,
     ##    row_number == 1) %.>%
-    ##  select_columns(.,
-    ##    subjectID, surveyCategory, probability) %.>%
+    ##  select_columns(., c(
+    ##    "subjectID", "surveyCategory", "probability")) %.>%
     ##  rename_columns(.,
     ##   c('diagnosis' = 'surveyCategory'))
 
diff --git a/Examples/LogisticExample/BuildDiagram_files/figure-gfm/diagram-1.png b/Examples/LogisticExample/BuildDiagram_files/figure-gfm/diagram-1.png
diff --git a/Examples/LogisticExample/ScoringExample.html b/Examples/LogisticExample/ScoringExample.html
@@ -13572,22 +13572,22 @@ <h3 id="SQL"><code>SQL</code><a class="anchor-link" href="#SQL">&#182;</a></h3><
 
 
 <div class="output_subarea output_stream output_stdout output_text">
-<pre>SELECT &#34;probability&#34;,
-       &#34;subjectid&#34;,
+<pre>SELECT &#34;subjectid&#34;,
+       &#34;probability&#34;,
        &#34;surveycategory&#34; AS &#34;diagnosis&#34;
 FROM
-  (SELECT &#34;probability&#34;,
-          &#34;subjectid&#34;,
+  (SELECT &#34;subjectid&#34;,
+          &#34;probability&#34;,
           &#34;surveycategory&#34;
    FROM
-     (SELECT &#34;probability&#34;,
-             &#34;subjectid&#34;,
+     (SELECT &#34;subjectid&#34;,
+             &#34;probability&#34;,
              &#34;surveycategory&#34;
       FROM
-        (SELECT &#34;surveycategory&#34;,
+        (SELECT &#34;sort_key&#34;,
                 &#34;subjectid&#34;,
-                &#34;sort_key&#34;,
                 &#34;probability&#34;,
+                &#34;surveycategory&#34;,
                 ROW_NUMBER() OVER (PARTITION BY &#34;subjectid&#34;
                                    ORDER BY &#34;sort_key&#34;) AS &#34;row_number&#34;
          FROM
@@ -13672,22 +13672,22 @@ <h3 id="SQL"><code>SQL</code><a class="anchor-link" href="#SQL">&#182;</a></h3><
   <thead>
     <tr style="text-align: right;">
       <th></th>
-      <th>probability</th>
       <th>subjectid</th>
+      <th>probability</th>
       <th>diagnosis</th>
     </tr>
   </thead>
   <tbody>
     <tr>
       <th>0</th>
-      <td>0.670622</td>
       <td>1.0</td>
+      <td>0.670622</td>
       <td>withdrawal behavior</td>
     </tr>
     <tr>
       <th>1</th>
-      <td>0.558974</td>
       <td>2.0</td>
+      <td>0.558974</td>
       <td>positive re-framing</td>
     </tr>
   </tbody>
@@ -14349,15 +14349,15 @@ <h3 id="R"><code>R</code><a class="anchor-link" href="#R">&#182;</a></h3><p>This
          &#34;assessmentTotal&#34;
         FROM
          &#34;d&#34;
-        ) tsql_21995480598153962875_0000000000
-       ) tsql_21995480598153962875_0000000001
-      ) tsql_21995480598153962875_0000000002
-     ) tsql_21995480598153962875_0000000003
-    ) tsql_21995480598153962875_0000000004
-  ) tsql_21995480598153962875_0000000005
+        ) tsql_85982078297649144292_0000000000
+       ) tsql_85982078297649144292_0000000001
+      ) tsql_85982078297649144292_0000000002
+     ) tsql_85982078297649144292_0000000003
+    ) tsql_85982078297649144292_0000000004
+  ) tsql_85982078297649144292_0000000005
   WHERE &#34;row_number&#34; = 1
- ) tsql_21995480598153962875_0000000006
-) tsql_21995480598153962875_0000000007
+ ) tsql_85982078297649144292_0000000006
+) tsql_85982078297649144292_0000000007
 </pre>
 </div>
 </div>
diff --git a/Examples/LogisticExample/ScoringExample.ipynb b/Examples/LogisticExample/ScoringExample.ipynb
@@ -477,22 +477,22 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "SELECT \"probability\",\n",
-      "       \"subjectid\",\n",
+      "SELECT \"subjectid\",\n",
+      "       \"probability\",\n",
       "       \"surveycategory\" AS \"diagnosis\"\n",
       "FROM\n",
-      "  (SELECT \"probability\",\n",
-      "          \"subjectid\",\n",
+      "  (SELECT \"subjectid\",\n",
+      "          \"probability\",\n",
       "          \"surveycategory\"\n",
       "   FROM\n",
-      "     (SELECT \"probability\",\n",
-      "             \"subjectid\",\n",
+      "     (SELECT \"subjectid\",\n",
+      "             \"probability\",\n",
       "             \"surveycategory\"\n",
       "      FROM\n",
-      "        (SELECT \"surveycategory\",\n",
+      "        (SELECT \"sort_key\",\n",
       "                \"subjectid\",\n",
-      "                \"sort_key\",\n",
       "                \"probability\",\n",
+      "                \"surveycategory\",\n",
       "                ROW_NUMBER() OVER (PARTITION BY \"subjectid\"\n",
       "                                   ORDER BY \"sort_key\") AS \"row_number\"\n",
       "         FROM\n",
@@ -571,32 +571,32 @@
        "  <thead>\n",
        "    <tr style=\"text-align: right;\">\n",
        "      <th></th>\n",
-       "      <th>probability</th>\n",
        "      <th>subjectid</th>\n",
+       "      <th>probability</th>\n",
        "      <th>diagnosis</th>\n",
        "    </tr>\n",
        "  </thead>\n",
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
-       "      <td>0.670622</td>\n",
        "      <td>1.0</td>\n",
+       "      <td>0.670622</td>\n",
        "      <td>withdrawal behavior</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
-       "      <td>0.558974</td>\n",
        "      <td>2.0</td>\n",
+       "      <td>0.558974</td>\n",
        "      <td>positive re-framing</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
        "</div>"
       ],
       "text/plain": [
-       "   probability  subjectid            diagnosis\n",
-       "0  0.670622     1.0        withdrawal behavior\n",
-       "1  0.558974     2.0        positive re-framing"
+       "   subjectid  probability            diagnosis\n",
+       "0  1.0        0.670622     withdrawal behavior\n",
+       "1  2.0        0.558974     positive re-framing"
       ]
      },
      "execution_count": 8,
@@ -1242,15 +1242,15 @@
       "         \"assessmentTotal\"\n",
       "        FROM\n",
       "         \"d\"\n",
-      "        ) tsql_21995480598153962875_0000000000\n",
-      "       ) tsql_21995480598153962875_0000000001\n",
-      "      ) tsql_21995480598153962875_0000000002\n",
-      "     ) tsql_21995480598153962875_0000000003\n",
-      "    ) tsql_21995480598153962875_0000000004\n",
-      "  ) tsql_21995480598153962875_0000000005\n",
+      "        ) tsql_85982078297649144292_0000000000\n",
+      "       ) tsql_85982078297649144292_0000000001\n",
+      "      ) tsql_85982078297649144292_0000000002\n",
+      "     ) tsql_85982078297649144292_0000000003\n",
+      "    ) tsql_85982078297649144292_0000000004\n",
+      "  ) tsql_85982078297649144292_0000000005\n",
       "  WHERE \"row_number\" = 1\n",
-      " ) tsql_21995480598153962875_0000000006\n",
-      ") tsql_21995480598153962875_0000000007\n"
+      " ) tsql_85982078297649144292_0000000006\n",
+      ") tsql_85982078297649144292_0000000007\n"
      ]
     }
    ],
diff --git a/Examples/LogisticExample/ScoringExample.md b/Examples/LogisticExample/ScoringExample.md
@@ -340,22 +340,22 @@ sql = ops.to_sql(db_model, pretty=True)
 print(sql)
 ```
 
-    SELECT "probability",
-           "subjectid",
+    SELECT "subjectid",
+           "probability",
            "surveycategory" AS "diagnosis"
     FROM
-      (SELECT "probability",
-              "subjectid",
+      (SELECT "subjectid",
+              "probability",
               "surveycategory"
        FROM
-         (SELECT "probability",
-                 "subjectid",
+         (SELECT "subjectid",
+                 "probability",
                  "surveycategory"
           FROM
-            (SELECT "surveycategory",
+            (SELECT "sort_key",
                     "subjectid",
-                    "sort_key",
                     "probability",
+                    "surveycategory",
                     ROW_NUMBER() OVER (PARTITION BY "subjectid"
                                        ORDER BY "sort_key") AS "row_number"
              FROM
@@ -414,22 +414,22 @@ db_model.read_query(conn, sql)
   <thead>
     <tr style="text-align: right;">
       <th></th>
-      <th>probability</th>
       <th>subjectid</th>
+      <th>probability</th>
       <th>diagnosis</th>
     </tr>
   </thead>
   <tbody>
     <tr>
       <th>0</th>
-      <td>0.670622</td>
       <td>1.0</td>
+      <td>0.670622</td>
       <td>withdrawal behavior</td>
     </tr>
     <tr>
       <th>1</th>
-      <td>0.558974</td>
       <td>2.0</td>
+      <td>0.558974</td>
       <td>positive re-framing</td>
     </tr>
   </tbody>
@@ -851,15 +851,15 @@ cat(sql)
              "assessmentTotal"
             FROM
              "d"
-            ) tsql_21995480598153962875_0000000000
-           ) tsql_21995480598153962875_0000000001
-          ) tsql_21995480598153962875_0000000002
-         ) tsql_21995480598153962875_0000000003
-        ) tsql_21995480598153962875_0000000004
-      ) tsql_21995480598153962875_0000000005
+            ) tsql_85982078297649144292_0000000000
+           ) tsql_85982078297649144292_0000000001
+          ) tsql_85982078297649144292_0000000002
+         ) tsql_85982078297649144292_0000000003
+        ) tsql_85982078297649144292_0000000004
+      ) tsql_85982078297649144292_0000000005
       WHERE "row_number" = 1
-     ) tsql_21995480598153962875_0000000006
-    ) tsql_21995480598153962875_0000000007
+     ) tsql_85982078297649144292_0000000006
+    ) tsql_85982078297649144292_0000000007
 
 
 The `R` implementation is mature, and appropriate to use in production.  The [`rquery`](https://github.com/WinVector/rquery) grammar is designed to have minimal state and minimal annotations (no grouping or ordering annotations!).  This makes the grammar, in my opinion, a good design choice. `rquery` has very good performance, often much faster than `dplyr` or base-`R` due to its query generation ideas and use of [`data.table`](https://CRAN.R-project.org/package=data.table) via [`rqdatatable`](https://CRAN.R-project.org/package=rqdatatable).  `rquery` is a mature pure `R` package; [here](https://github.com/WinVector/rquery/blob/master/README.md) is the same example being worked directly in `R`, with no translation from `Python`.