Fix missing dependency declaration and use ROS param config

kPatch · kPatch · commit 9e6068274bdd · 2025-07-15T23:43:54.000-04:00
diff --git a/coffee_ws/src/effector_nodes/effector_nodes/tts_node/node.py b/coffee_ws/src/effector_nodes/effector_nodes/tts_node/node.py
@@ -19,26 +19,38 @@ def __init__(self):
         super().__init__('tts_node')
         self.get_logger().info("TTS node initialized")
 
+        # Declare parameters
+        self.declare_parameter('voice_id', "KTPVrSVAEUSJRClDzBw7")  # Default voice ID
+        self.declare_parameter('model_id', "eleven_multilingual_v2")  # Default model
+        self.declare_parameter('api_key', '')  # Empty by default, will check env var
+        self.declare_parameter('cooldown_duration', 1.0)  # Cooldown in seconds
+        self.declare_parameter('output_format', 'pcm_24000')  # Audio output format
+
+        # Get parameters
+        self.voice_id = self.get_parameter('voice_id').value
+        self.model_id = self.get_parameter('model_id').value
+        self.COOLDOWN_DURATION = self.get_parameter('cooldown_duration').value
+        self.output_format = self.get_parameter('output_format').value
+
         self.service_group = MutuallyExclusiveCallbackGroup()
         self.timer_group = MutuallyExclusiveCallbackGroup()
         
         # Cooldown settings
         self.cooldown_timer = None
         self.in_cooldown = False
-        self.COOLDOWN_DURATION = 1.0  # seconds
 
         # Initialize Eleven Labs SDK client
-        api_key = os.environ.get('ELEVEN_LABS_API_KEY')
+        api_key = self.get_parameter('api_key').value
+        if not api_key:
+            api_key = os.environ.get('ELEVEN_LABS_API_KEY')
+        
         if not api_key:
-            self.get_logger().error("ELEVEN_LABS_API_KEY environment variable not set")
-            raise ValueError("ELEVEN_LABS_API_KEY environment variable is required, refer to the README for more information")
+            self.get_logger().error("ELEVEN_LABS_API_KEY not set in parameter or environment variable")
+            raise ValueError("ELEVEN_LABS_API_KEY is required. Set it as a ROS2 parameter or environment variable. Refer to the README for more information")
         
         self.eleven_labs_client = ElevenLabs(api_key=api_key)
 
-        self.voice_id = "KTPVrSVAEUSJRClDzBw7" # https://elevenlabs.io/app/voice-library/collections/HXn5AetPOJgAHd2D60mP?voiceId=KTPVrSVAEUSJRClDzBw7
-        self.model_id = "eleven_multilingual_v2"
-
-        self.get_logger().info("Eleven Labs SDK initialized")
+        self.get_logger().info(f"Eleven Labs SDK initialized with voice: {self.voice_id}, model: {self.model_id}")
 
         self.audio_player = pyaudio.PyAudio()
 
@@ -75,7 +87,11 @@ def __init__(self):
     def publish_status(self):
         """Publish current status information"""
         status = {
-            "health": "ok"
+            "health": "ok",
+            "voice_id": self.voice_id,
+            "model_id": self.model_id,
+            "is_playing": self.is_playing,
+            "in_cooldown": self.in_cooldown
         }
         
         msg = String()
@@ -120,7 +136,7 @@ def stream_audio_playback(self, text):
                 
                 # Request PCM audio format (raw audio data)
                 # pcm_16000 = 16kHz sample rate, pcm_24000 = 24kHz sample rate
-                output_format = "pcm_24000"
+                output_format = self.output_format
                 
                 self.get_logger().info(f"Starting audio streaming with format: {output_format}")
                 
diff --git a/coffee_ws/src/effector_nodes/launch/tts_node.launch.py b/coffee_ws/src/effector_nodes/launch/tts_node.launch.py
@@ -0,0 +1,77 @@
+#!/usr/bin/env python3
+
+from launch import LaunchDescription
+from launch.actions import DeclareLaunchArgument, LogInfo
+from launch.substitutions import LaunchConfiguration, TextSubstitution
+from launch_ros.actions import Node
+
+
+def generate_launch_description():
+    """Generate launch description for TTS node with configurable parameters."""
+    
+    # Declare launch arguments
+    voice_id_arg = DeclareLaunchArgument(
+        'voice_id',
+        default_value='KTPVrSVAEUSJRClDzBw7',
+        description='ElevenLabs voice ID to use for TTS'
+    )
+    
+    model_id_arg = DeclareLaunchArgument(
+        'model_id',
+        default_value='eleven_multilingual_v2',
+        description='ElevenLabs model ID to use for TTS'
+    )
+    
+    api_key_arg = DeclareLaunchArgument(
+        'api_key',
+        default_value='',
+        description='ElevenLabs API key (leave empty to use ELEVEN_LABS_API_KEY environment variable)'
+    )
+    
+    cooldown_duration_arg = DeclareLaunchArgument(
+        'cooldown_duration',
+        default_value='1.0',
+        description='Cooldown duration in seconds between TTS requests'
+    )
+    
+    output_format_arg = DeclareLaunchArgument(
+        'output_format',
+        default_value='pcm_24000',
+        description='Audio output format (pcm_16000, pcm_24000, etc.)'
+    )
+    
+    # TTS Node
+    tts_node = Node(
+        package='effector_nodes',
+        executable='tts_node',
+        name='tts_node',
+        output='screen',
+        emulate_tty=True,
+        parameters=[{
+            'voice_id': LaunchConfiguration('voice_id'),
+            'model_id': LaunchConfiguration('model_id'),
+            'api_key': LaunchConfiguration('api_key'),
+            'cooldown_duration': LaunchConfiguration('cooldown_duration'),
+            'output_format': LaunchConfiguration('output_format'),
+        }]
+    )
+    
+    # Log info about the launch
+    log_info = LogInfo(
+        msg=[
+            'Starting TTS Node with voice: ',
+            LaunchConfiguration('voice_id'),
+            ' and model: ',
+            LaunchConfiguration('model_id')
+        ]
+    )
+    
+    return LaunchDescription([
+        voice_id_arg,
+        model_id_arg,
+        api_key_arg,
+        cooldown_duration_arg,
+        output_format_arg,
+        log_info,
+        tts_node
+    ]) 
diff --git a/coffee_ws/src/effector_nodes/package.xml b/coffee_ws/src/effector_nodes/package.xml
@@ -3,10 +3,22 @@
 <package format="3">
   <name>effector_nodes</name>
   <version>0.0.0</version>
-  <description>TODO: Package description</description>
-  <maintainer email="Marcus.Arnett10@gmail.com">vr-workstation-2</maintainer>
-  <license>TODO: License declaration</license>
+  <description>ROS2 package providing Text-to-Speech (TTS) effector nodes for the Coffee Buddy robot system using ElevenLabs API</description>
+  <maintainer email="marcus@opendive.io">vr-workstation-2</maintainer>
+  <license>Apache-2.0</license>
 
+  <!-- Core ROS2 dependencies -->
+  <depend>rclpy</depend>
+  <depend>std_msgs</depend>
+  
+  <!-- Coffee Buddy specific message dependencies -->
+  <depend>coffee_buddy_msgs</depend>
+  <depend>shared_configs</depend>
+  
+  <!-- System dependencies for audio -->
+  <depend>python3-pyaudio</depend>
+
+  <!-- Test dependencies -->
   <test_depend>ament_copyright</test_depend>
   <test_depend>ament_flake8</test_depend>
   <test_depend>ament_pep257</test_depend>
diff --git a/coffee_ws/src/effector_nodes/setup.py b/coffee_ws/src/effector_nodes/setup.py
@@ -10,13 +10,18 @@
         ('share/ament_index/resource_index/packages',
             ['resource/' + package_name]),
         ('share/' + package_name, ['package.xml']),
+        ('share/' + package_name + '/launch', ['launch/tts_node.launch.py']),
+    ],
+    install_requires=[
+        'setuptools',
+        'elevenlabs==1.57.0',
+        'PyAudio==0.2.14',
     ],
-    install_requires=['setuptools'],
     zip_safe=True,
     maintainer='vr-workstation-2',
-    maintainer_email='Marcus.Arnett10@gmail.com',
-    description='TODO: Package description',
-    license='TODO: License declaration',
+    maintainer_email='marcus@opendive.io',
+    description='ROS2 package providing Text-to-Speech (TTS) effector nodes for the Coffee Buddy robot system using ElevenLabs API',
+    license='Apache-2.0',
     tests_require=['pytest'],
     entry_points={
         'console_scripts': [