microsoft
diff --git a/‎py-src/data_formulator/db_manager.py
Lines changed: 3 additions & 0 deletions b/‎py-src/data_formulator/db_manager.py
Lines changed: 3 additions & 0 deletions
diff --git a/‎py-src/data_formulator/tables_routes.py
Lines changed: 113 additions & 87 deletions b/‎py-src/data_formulator/tables_routes.py
Lines changed: 113 additions & 87 deletions
diff --git a/‎src/app/App.tsx
Lines changed: 8 additions & 8 deletions b/‎src/app/App.tsx
Lines changed: 8 additions & 8 deletions
diff --git a/‎src/app/dfSlice.tsx
Lines changed: 6 additions & 22 deletions b/‎src/app/dfSlice.tsx
Lines changed: 6 additions & 22 deletions
@@ -1,3 +1,6 @@
+# Copyright (c) Microsoft Corporation.
+# Licensed under the MIT License.
+
 import duckdb
 import pandas as pd
 from typing import Dict
 
@@ -14,6 +14,7 @@
 import random
 import string
 from pathlib import Path
+import uuid
 
 from data_formulator.db_manager import db_manager
 from data_formulator.data_loader import DATA_LOADERS
@@ -36,62 +37,72 @@
 
 tables_bp = Blueprint('tables', __name__, url_prefix='/api/tables')
 
+
+def list_tables_util(db_conn):
+    """
+    List all tables in the current session
+    """
+    results = []
+    
+    table_metadata_list = db_conn.execute("""
+        SELECT database_name, schema_name, table_name, schema_name==current_schema() as is_current_schema, 'table' as object_type 
+        FROM duckdb_tables() 
+        WHERE internal=False AND database_name == current_database()
+        UNION ALL 
+        SELECT database_name, schema_name, view_name as table_name, schema_name==current_schema() as is_current_schema, 'view' as object_type 
+        FROM duckdb_views()
+        WHERE view_name NOT LIKE 'duckdb_%' AND view_name NOT LIKE 'sqlite_%' AND view_name NOT LIKE 'pragma_%' AND database_name == current_database()
+    """).fetchall()
+
+    for table_metadata in table_metadata_list:
+        [database_name, schema_name, table_name, is_current_schema, object_type] = table_metadata
+        table_name = table_name if is_current_schema else '.'.join([database_name, schema_name, table_name])
+        if database_name in ['system', 'temp']:
+            continue
+        
+        print(f"table_metadata: {table_metadata}")
+
+        try:
+            # Get column information
+            columns = db_conn.execute(f"DESCRIBE {table_name}").fetchall()
+                
+            # Get row count
+            row_count = db_conn.execute(f"SELECT COUNT(*) FROM {table_name}").fetchone()[0]
+            sample_rows = db_conn.execute(f"SELECT * FROM {table_name} LIMIT 1000").fetchdf() if row_count > 0 else pd.DataFrame()
+            
+            # Check if this is a view or a table
+            try:
+                # Get both view existence and source in one query
+                view_info = db_conn.execute(f"SELECT view_name, sql FROM duckdb_views() WHERE view_name = '{table_name}'").fetchone()
+                view_source = view_info[1] if view_info else None
+            except Exception as e:
+                # If the query fails, assume it's a regular table
+                view_source = None
+
+            results.append({
+                "name": table_name,
+                "columns": [{"name": col[0], "type": col[1]} for col in columns],
+                "row_count": row_count,
+                "sample_rows": json.loads(sample_rows.to_json(orient='records')),
+                "view_source": view_source
+            })
+        except Exception as e:
+            logger.error(f"Error getting table metadata for {table_name}: {str(e)}")
+            continue
+
+    return results
+
 @tables_bp.route('/list-tables', methods=['GET'])
 def list_tables():
     """List all tables in the current session"""
     try:
-        result = []
         with db_manager.connection(session['session_id']) as db:
-            table_metadata_list = db.execute("""
-                SELECT database_name, schema_name, table_name, schema_name==current_schema() as is_current_schema, 'table' as object_type 
-                FROM duckdb_tables() 
-                WHERE internal=False AND database_name == current_database()
-                UNION ALL 
-                SELECT database_name, schema_name, view_name as table_name, schema_name==current_schema() as is_current_schema, 'view' as object_type 
-                FROM duckdb_views()
-                WHERE view_name NOT LIKE 'duckdb_%' AND view_name NOT LIKE 'sqlite_%' AND view_name NOT LIKE 'pragma_%' AND database_name == current_database()
-            """).fetchall()
+            results = list_tables_util(db)
 
-            
-            for table_metadata in table_metadata_list:
-                [database_name, schema_name, table_name, is_current_schema, object_type] = table_metadata
-                table_name = table_name if is_current_schema else '.'.join([database_name, schema_name, table_name])
-                if database_name in ['system', 'temp']:
-                    continue
-                
-                print(f"table_metadata: {table_metadata}")
-
-                try:
-                    # Get column information
-                    columns = db.execute(f"DESCRIBE {table_name}").fetchall()
-                    # Get row count
-                    row_count = db.execute(f"SELECT COUNT(*) FROM {table_name}").fetchone()[0]
-                    sample_rows = db.execute(f"SELECT * FROM {table_name} LIMIT 1000").fetchdf()
-                    
-                    # Check if this is a view or a table
-                    try:
-                        # Get both view existence and source in one query
-                        view_info = db.execute(f"SELECT view_name, sql FROM duckdb_views() WHERE view_name = '{table_name}'").fetchone()
-                        view_source = view_info[1] if view_info else None
-                    except Exception as e:
-                        # If the query fails, assume it's a regular table
-                        view_source = None
-
-                    result.append({
-                        "name": table_name,
-                        "columns": [{"name": col[0], "type": col[1]} for col in columns],
-                        "row_count": row_count,
-                        "sample_rows": json.loads(sample_rows.to_json(orient='records')),
-                        "view_source": view_source
-                    })
-                except Exception as e:
-                    logger.error(f"Error getting table metadata for {table_name}: {str(e)}")
-                    continue
-        
-        return jsonify({
-            "status": "success",
-            "tables": result
-        })
+            return jsonify({
+                "status": "success",
+                "tables": results
+            })
     except Exception as e:
         logger.error(f"Error listing tables: {str(e)}")
         safe_msg, status_code = sanitize_db_error_message(e)
@@ -126,7 +137,7 @@ def assemble_query(aggregate_fields_and_functions, group_fields, columns, table_
         elif field in columns:
             if function.lower() == 'count':
                 alias = f'_count'
-                select_parts.append(f'COUNT(*) as {alias}')
+                select_parts.append(f'COUNT(*) as "{alias}"')
                 output_column_names.append(alias)
             else:
                 # Sanitize function name and create alias
@@ -136,7 +147,7 @@ def assemble_query(aggregate_fields_and_functions, group_fields, columns, table_
                     aggregate_function = function.upper()
 
                 alias = f'{field}_{function}'
-                select_parts.append(f'{aggregate_function}("{field}") as {alias}')
+                select_parts.append(f'{aggregate_function}("{field}") as "{alias}"')
                 output_column_names.append(alias)
 
     # Handle group fields
@@ -288,36 +299,36 @@ def get_table_data():
 def create_table():
     """Create a new table from uploaded data"""
     try:
-        if 'file' not in request.files:
-            return jsonify({"status": "error", "message": "No file provided"}), 400
+        if 'file' not in request.files and 'raw_data' not in request.form:
+            return jsonify({"status": "error", "message": "No file or raw data provided"}), 400
 
-        file = request.files['file']
         table_name = request.form.get('table_name')
-
-        print(f"table_name: {table_name}")
-        print(f"file: {file.filename}")
-        print(f"file: {file}")
-        
         if not table_name:
             return jsonify({"status": "error", "message": "No table name provided"}), 400
-            
-        # Sanitize table name:
-        # 1. Convert to lowercase
-        # 2. Replace hyphens with underscores
-        # 3. Replace spaces with underscores
-        # 4. Remove any other special characters
-        sanitized_table_name = table_name.lower()
-        sanitized_table_name = sanitized_table_name.replace('-', '_')
-        sanitized_table_name = sanitized_table_name.replace(' ', '_')
-        sanitized_table_name = ''.join(c for c in sanitized_table_name if c.isalnum() or c == '_')
 
-        # Ensure table name starts with a letter
-        if not sanitized_table_name or not sanitized_table_name[0].isalpha():
-            sanitized_table_name = 'table_' + sanitized_table_name
-            
-        # Verify we have a valid table name after sanitization
-        if not sanitized_table_name:
-            return jsonify({"status": "error", "message": "Invalid table name"}), 400
+        df = None
+        if 'file' in request.files:
+            file = request.files['file']
+            # Read file based on extension
+            if file.filename.endswith('.csv'):
+                df = pd.read_csv(file)
+            elif file.filename.endswith(('.xlsx', '.xls')):
+                df = pd.read_excel(file)
+            elif file.filename.endswith('.json'):
+                df = pd.read_json(file)
+            else:
+                return jsonify({"status": "error", "message": "Unsupported file format"}), 400
+        else:
+            raw_data = request.form.get('raw_data')
+            try:
+                df = pd.DataFrame(json.loads(raw_data))
+            except Exception as e:
+                return jsonify({"status": "error", "message": f"Invalid JSON data: {str(e)}, it must be in the format of a list of dictionaries"}), 400
+
+        if df is None:
+            return jsonify({"status": "error", "message": "No data provided"}), 400
+
+        sanitized_table_name = sanitize_table_name(table_name)
 
         with db_manager.connection(session['session_id']) as db:
             # Check if table exists and generate unique name if needed
@@ -331,16 +342,6 @@ def create_table():
                 # If exists, append counter to base name
                 sanitized_table_name = f"{base_name}_{counter}"
                 counter += 1
-        
-            # Read file based on extension
-            if file.filename.endswith('.csv'):
-                df = pd.read_csv(file)
-            elif file.filename.endswith(('.xlsx', '.xls')):
-                df = pd.read_excel(file)
-            elif file.filename.endswith('.json'):
-                df = pd.read_json(file)
-            else:
-                return jsonify({"status": "error", "message": "Unsupported file format"}), 400
 
             # Create table
             db.register('df_temp', df)
@@ -364,6 +365,8 @@ def create_table():
             "message": safe_msg
         }), status_code
 
+
+
 @tables_bp.route('/delete-table', methods=['POST'])
 def drop_table():
     """Drop a table or view"""
@@ -679,6 +682,29 @@ def analyze_table():
             "message": safe_msg
         }), status_code
 
+def sanitize_table_name(table_name: str) -> str:
+    """
+    Sanitize a table name to be a valid DuckDB table name.
+    """
+    # Sanitize table name:
+        # 1. Convert to lowercase
+        # 2. Replace hyphens with underscores
+        # 3. Replace spaces with underscores
+        # 4. Remove any other special characters
+    sanitized_table_name = table_name.lower()
+    sanitized_table_name = sanitized_table_name.replace('-', '_')
+    sanitized_table_name = sanitized_table_name.replace(' ', '_')
+    sanitized_table_name = ''.join(c for c in sanitized_table_name if c.isalnum() or c == '_')
+    
+    # Ensure table name starts with a letter
+    if not sanitized_table_name or not sanitized_table_name[0].isalpha():
+        sanitized_table_name = 'table_' + sanitized_table_name
+        
+    # Verify we have a valid table name after sanitization
+    if not sanitized_table_name:
+        return f'table_{uuid.uuid4()}'
+    return sanitized_table_name
+
 def sanitize_db_error_message(error: Exception) -> Tuple[str, int]:
     """
     Sanitize error messages before sending to client.
 
@@ -197,10 +197,10 @@ const TableMenu: React.FC = () => {
                 anchorEl={anchorEl}
                 open={open}
                 onClose={() => setAnchorEl(null)}
-                MenuListProps={{
-                    'aria-labelledby': 'add-table-button',
-                    sx: { py: '4px', px: '8px' }
+                slotProps={{
+                    paper: { sx: { py: '4px', px: '8px' } }
                 }}
+                aria-labelledby="add-table-button"
                 sx={{ '& .MuiMenuItem-root': { padding: 0, margin: 0 } }}
             >
                 <MenuItem onClick={(e) => {
@@ -247,16 +247,16 @@ const SessionMenu: React.FC = () => {
                 anchorEl={anchorEl}
                 open={open}
                 onClose={() => setAnchorEl(null)}
-                MenuListProps={{
-                    'aria-labelledby': 'session-menu-button',
-                    sx: { py: '4px', px: '8px' }
+                slotProps={{
+                    paper: { sx: { py: '4px', px: '8px' } }
                 }}
+                aria-labelledby="session-menu-button"
                 sx={{ '& .MuiMenuItem-root': { padding: 0, margin: 0 } }}
             >
                 {sessionId && (
                     <MenuItem disabled>
-                        <Typography sx={{ fontSize: 12, color: 'text.secondary', mx: 2 }}>
-                            ID: {sessionId}
+                        <Typography sx={{ fontSize: 12, color: 'text.secondary'}}>
+                            session id: {sessionId}
                         </Typography>
                     </MenuItem>
                 )}
 
@@ -11,7 +11,8 @@ import { getDataTable } from '../views/VisualizationView';
 import { adaptChart, getTriggers, getUrls } from './utils';
 import { Type } from '../data/types';
 import { TableChallenges } from '../views/TableSelectionView';
-import { inferTypeFromValueArray } from '../data/utils';
+import { createTableFromFromObjectArray, inferTypeFromValueArray } from '../data/utils';
+import { handleSSEMessage } from './SSEActions';
 
 enableMapSet();
 
@@ -27,7 +28,7 @@ export const generateFreshChart = (tableRef: string, chartType?: string) : Chart
 }
 
 export interface SSEMessage {
-    type: "notification" | "action"; 
+    type: "heartbeat" | "notification" | "action"; 
     text: string;
     data?: Record<string, any>;
     timestamp: number;
@@ -81,7 +82,7 @@ export interface DataFormulatorState {
 
     dataLoaderConnectParams: Record<string, Record<string, string>>; // {table_name: {param_name: param_value}}
 
-    lastSSEMessage: SSEMessage | undefined; // Store the last received SSE message
+    pendingSSEActions: SSEMessage[]; // Actions taken by the server but not yet completed
 }
 
 // Define the initial state using that type
@@ -123,7 +124,7 @@ const initialState: DataFormulatorState = {
 
     dataLoaderConnectParams: {},
 
-    lastSSEMessage: undefined,
+    pendingSSEActions: [],
 }
 
 let getUnrefedDerivedTableIds = (state: DataFormulatorState) => {
@@ -768,24 +769,7 @@ export const dataFormulatorSlice = createSlice({
             delete state.dataLoaderConnectParams[dataLoaderType];
         },
         handleSSEMessage: (state, action: PayloadAction<SSEMessage>) => {
-            state.lastSSEMessage = action.payload;
-            if (action.payload.type == "notification") {
-                console.log('SSE message stored in Redux:', action.payload);
-                state.messages = [...state.messages, {
-                    component: "server",
-                    type: "info",
-                    timestamp: action.payload.timestamp,
-                    value: action.payload.text || "Unknown message"
-                }];
-            } else if (action.payload.type == "action") {
-                console.log('SSE message stored in Redux:', action.payload);
-                state.messages = [...state.messages, {
-                    component: "server",
-                    type: "info",
-                    timestamp: action.payload.timestamp,
-                    value: action.payload.text || "Unknown message"
-                }];
-            }
+            handleSSEMessage(state, action.payload);
         },
         clearMessages: (state) => {
             state.messages = [];