lensesio
diff --git a/‎kafka-connect-aws-s3/src/test/scala/io/lenses/streamreactor/connect/aws/s3/storage/AwsS3StorageInterfaceTest.scala‎
Lines changed: 16 additions & 10 deletions b/‎kafka-connect-aws-s3/src/test/scala/io/lenses/streamreactor/connect/aws/s3/storage/AwsS3StorageInterfaceTest.scala‎
Lines changed: 16 additions & 10 deletions
diff --git a/‎kafka-connect-cloud-common/src/main/scala/io/lenses/streamreactor/connect/cloud/common/formats/reader/AvroStreamReader.scala‎
Lines changed: 2 additions & 2 deletions b/‎kafka-connect-cloud-common/src/main/scala/io/lenses/streamreactor/connect/cloud/common/formats/reader/AvroStreamReader.scala‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎kafka-connect-cloud-common/src/main/scala/io/lenses/streamreactor/connect/cloud/common/formats/reader/ParquetStreamReader.scala‎
Lines changed: 2 additions & 2 deletions b/‎kafka-connect-cloud-common/src/main/scala/io/lenses/streamreactor/connect/cloud/common/formats/reader/ParquetStreamReader.scala‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎kafka-connect-cloud-common/src/main/scala/io/lenses/streamreactor/connect/cloud/common/sink/conversion/ToAvroDataConverter.scala‎
Lines changed: 33 additions & 14 deletions b/‎kafka-connect-cloud-common/src/main/scala/io/lenses/streamreactor/connect/cloud/common/sink/conversion/ToAvroDataConverter.scala‎
Lines changed: 33 additions & 14 deletions
diff --git a/‎kafka-connect-cloud-common/src/test/scala/io/lenses/streamreactor/connect/cloud/common/formats/writer/ParquetFormatWriterSchemaEvolutionTest.scala‎
Lines changed: 3 additions & 11 deletions b/‎kafka-connect-cloud-common/src/test/scala/io/lenses/streamreactor/connect/cloud/common/formats/writer/ParquetFormatWriterSchemaEvolutionTest.scala‎
Lines changed: 3 additions & 11 deletions
@@ -43,9 +43,11 @@ class AwsS3StorageInterfaceTest
     val s3Client         = mock[S3Client]
     val storageInterface = new AwsS3StorageInterface(mock[ConnectorTaskId], s3Client, batchDelete = false, None)
 
-    when(s3Client.headObject(any[HeadObjectRequest])).thenAnswer(HeadObjectResponse.builder().build())
-    when(s3Client.copyObject(any[CopyObjectRequest])).thenAnswer(CopyObjectResponse.builder().build())
-    when(s3Client.deleteObject(any[DeleteObjectRequest])).thenAnswer(DeleteObjectResponse.builder().build())
+    org.mockito.Mockito.doReturn(HeadObjectResponse.builder().build()).when(s3Client).headObject(any[HeadObjectRequest])
+    org.mockito.Mockito.doReturn(CopyObjectResponse.builder().build()).when(s3Client).copyObject(any[CopyObjectRequest])
+    org.mockito.Mockito.doReturn(DeleteObjectResponse.builder().build()).when(s3Client).deleteObject(
+      any[DeleteObjectRequest],
+    )
 
     val result = storageInterface.mvFile("oldBucket", "oldPath", "newBucket", "newPath", none)
 
@@ -58,7 +60,7 @@ class AwsS3StorageInterfaceTest
     val s3Client         = mock[S3Client]
     val storageInterface = new AwsS3StorageInterface(mock[ConnectorTaskId], s3Client, batchDelete = false, None)
 
-    when(s3Client.copyObject(any[CopyObjectRequest])).thenThrow(new RuntimeException("Copy failed"))
+    org.mockito.Mockito.doThrow(new RuntimeException("Copy failed")).when(s3Client).copyObject(any[CopyObjectRequest])
 
     val result = storageInterface.mvFile("oldBucket", "oldPath", "newBucket", "newPath", none)
 
@@ -72,9 +74,11 @@ class AwsS3StorageInterfaceTest
     val s3Client         = mock[S3Client]
     val storageInterface = new AwsS3StorageInterface(mock[ConnectorTaskId], s3Client, batchDelete = false, None)
 
-    when(s3Client.headObject(any[HeadObjectRequest])).thenAnswer(HeadObjectResponse.builder().build())
-    when(s3Client.copyObject(any[CopyObjectRequest])).thenAnswer(CopyObjectResponse.builder().build())
-    when(s3Client.deleteObject(any[DeleteObjectRequest])).thenThrow(new RuntimeException("Delete failed"))
+    org.mockito.Mockito.doReturn(HeadObjectResponse.builder().build()).when(s3Client).headObject(any[HeadObjectRequest])
+    org.mockito.Mockito.doReturn(CopyObjectResponse.builder().build()).when(s3Client).copyObject(any[CopyObjectRequest])
+    org.mockito.Mockito.doThrow(new RuntimeException("Delete failed")).when(s3Client).deleteObject(
+      any[DeleteObjectRequest],
+    )
 
     val result = storageInterface.mvFile("oldBucket", "oldPath", "newBucket", "newPath", none)
 
@@ -88,9 +92,11 @@ class AwsS3StorageInterfaceTest
     val s3Client         = mock[S3Client]
     val storageInterface = new AwsS3StorageInterface(mock[ConnectorTaskId], s3Client, batchDelete = false, None)
 
-    when(s3Client.headObject(any[HeadObjectRequest])).thenThrow(NoSuchKeyException.builder().build())
-    when(s3Client.copyObject(any[CopyObjectRequest])).thenAnswer(CopyObjectResponse.builder().build())
-    when(s3Client.deleteObject(any[DeleteObjectRequest])).thenThrow(new RuntimeException("Delete failed"))
+    org.mockito.Mockito.doThrow(NoSuchKeyException.builder().build()).when(s3Client).headObject(any[HeadObjectRequest])
+    org.mockito.Mockito.doReturn(CopyObjectResponse.builder().build()).when(s3Client).copyObject(any[CopyObjectRequest])
+    org.mockito.Mockito.doThrow(new RuntimeException("Delete failed")).when(s3Client).deleteObject(
+      any[DeleteObjectRequest],
+    )
 
     val result = storageInterface.mvFile("oldBucket", "oldPath", "newBucket", "newPath", none)
 
 
@@ -15,7 +15,7 @@
  */
 package io.lenses.streamreactor.connect.cloud.common.formats.reader
 
-import io.confluent.connect.avro.AvroData
+import io.lenses.streamreactor.connect.avro.AvroDataFactory
 import org.apache.avro.file.DataFileStream
 import org.apache.avro.generic.GenericDatumReader
 import org.apache.avro.generic.GenericRecord
@@ -25,7 +25,7 @@ import java.io.InputStream
 import scala.util.Try
 
 class AvroStreamReader(input: InputStream) extends CloudDataIterator[SchemaAndValue] {
-  private val avroDataConverter = new AvroData(100)
+  private val avroDataConverter = AvroDataFactory.create()
 
   private val datumReader = new GenericDatumReader[GenericRecord]()
 
 
@@ -16,7 +16,7 @@
 package io.lenses.streamreactor.connect.cloud.common.formats.reader
 
 import cats.implicits.catsSyntaxEitherId
-import io.confluent.connect.avro.AvroData
+import io.lenses.streamreactor.connect.avro.AvroDataFactory
 import io.lenses.streamreactor.connect.cloud.common.formats.reader.parquet.ParquetSeekableInputStream
 import io.lenses.streamreactor.connect.cloud.common.formats.reader.parquet.ParquetStreamingInputFile
 import org.apache.avro.generic.GenericRecord
@@ -34,7 +34,7 @@ class ParquetStreamReader(
 ) extends CloudDataIterator[SchemaAndValue]
     with Using {
   private val parquetReaderIteratorAdaptor = new ParquetReaderIteratorAdaptor(reader)
-  private val avroDataConverter            = new AvroData(100)
+  private val avroDataConverter            = AvroDataFactory.create()
 
   override def close(): Unit = {
     val _ = Try(reader.close())
 
@@ -15,9 +15,7 @@
  */
 package io.lenses.streamreactor.connect.cloud.common.sink.conversion
 
-import io.confluent.connect.avro.AvroData
-import io.confluent.connect.avro.AvroDataConfig
-import io.confluent.connect.schema.AbstractDataConfig
+import io.lenses.streamreactor.connect.avro.AvroDataFactory
 import org.apache.avro.Schema
 import org.apache.kafka.connect.data.Struct
 import org.apache.kafka.connect.data.{ Schema => ConnectSchema }
@@ -39,13 +37,33 @@ import scala.jdk.CollectionConverters.SeqHasAsJava
 
 object ToAvroDataConverter {
 
-  private val avroDataConfig = new AvroDataConfig(
-    Map(
-      AvroDataConfig.ENHANCED_AVRO_SCHEMA_SUPPORT_CONFIG -> "true",
-      AbstractDataConfig.SCHEMAS_CACHE_SIZE_CONFIG       -> "100",
-    ).asJava,
+  private val avroDataConverter = AvroDataFactory.create(100)
+
+  /** Schema name used by Confluent's AvroConverter for union types */
+  private val ConfluentAvroUnionSchemaName = "io.confluent.connect.avro.Union"
+
+  /**
+   * Mapping from Kafka Connect Schema.Type to Avro Schema.Type.
+   * Connect and Avro use different naming conventions for their types:
+   *   Connect: INT8, INT16, INT32, INT64, FLOAT32, FLOAT64, STRUCT
+   *   Avro:    INT,  INT,   INT,   LONG,  FLOAT,   DOUBLE,  RECORD
+   * This map is used in the fallback branch of union type matching
+   * where the primary name-based match has already failed.
+   */
+  private val connectToAvroType: Map[ConnectSchema.Type, Schema.Type] = Map(
+    ConnectSchema.Type.INT8    -> Schema.Type.INT,
+    ConnectSchema.Type.INT16   -> Schema.Type.INT,
+    ConnectSchema.Type.INT32   -> Schema.Type.INT,
+    ConnectSchema.Type.INT64   -> Schema.Type.LONG,
+    ConnectSchema.Type.FLOAT32 -> Schema.Type.FLOAT,
+    ConnectSchema.Type.FLOAT64 -> Schema.Type.DOUBLE,
+    ConnectSchema.Type.BOOLEAN -> Schema.Type.BOOLEAN,
+    ConnectSchema.Type.STRING  -> Schema.Type.STRING,
+    ConnectSchema.Type.BYTES   -> Schema.Type.BYTES,
+    ConnectSchema.Type.ARRAY   -> Schema.Type.ARRAY,
+    ConnectSchema.Type.MAP     -> Schema.Type.MAP,
+    ConnectSchema.Type.STRUCT  -> Schema.Type.RECORD,
   )
-  private val avroDataConverter = new AvroData(avroDataConfig)
 
   def convertSchema(connectSchema: ConnectSchema): Schema = avroDataConverter.fromConnectSchema(connectSchema)
 
@@ -246,9 +264,13 @@ object ToAvroDataConverter {
             // Convert the value using the matched schema
             convertFieldValue(fieldValue, avroSchema)
           case None =>
-            // Fallback: try to find by type match
+            // Fallback: try to find by type match using the Connect-to-Avro type mapping.
+            // Connect and Avro use different type names (e.g. INT32 vs INT, INT64 vs LONG,
+            // FLOAT32 vs FLOAT, FLOAT64 vs DOUBLE, STRUCT vs RECORD), so a direct string
+            // comparison would fail for these types.
             val typeMatchSchema = targetUnionSchema.getTypes.asScala.find { avroType =>
-              avroType.getType != Schema.Type.NULL && fieldSchema.`type`().getName.toUpperCase == avroType.getType.name()
+              avroType.getType != Schema.Type.NULL &&
+              connectToAvroType.get(fieldSchema.`type`()).contains(avroType.getType)
             }
             typeMatchSchema.map(convertFieldValue(fieldValue, _)).getOrElse(fieldValue)
         }
@@ -259,9 +281,6 @@ object ToAvroDataConverter {
     }
   }
 
-  /** Schema name used by Confluent's AvroConverter for union types */
-  private val ConfluentAvroUnionSchemaName = "io.confluent.connect.avro.Union"
-
   private def convertDateToDaysFromEpoch[A <: Any](value: Date) =
     ChronoUnit.DAYS.between(LocalDate.ofEpochDay(0), LocalDate.ofInstant(value.toInstant, ZoneId.systemDefault()))
 
 
@@ -15,8 +15,7 @@
  */
 package io.lenses.streamreactor.connect.cloud.common.formats.writer
 
-import io.confluent.connect.avro.AvroData
-import io.confluent.connect.avro.AvroDataConfig
+import io.lenses.streamreactor.connect.avro.AvroDataFactory
 import io.lenses.streamreactor.connect.cloud.common.model.CompressionCodec
 import io.lenses.streamreactor.connect.cloud.common.model.CompressionCodecName.UNCOMPRESSED
 import io.lenses.streamreactor.connect.cloud.common.model.Offset
@@ -358,15 +357,8 @@ class ParquetFormatWriterSchemaEvolutionTest extends AnyFlatSpec with Matchers w
     val avroSchemaV2 = parser.parse(avroSchemaV2Json)
     val avroSchemaV3 = new Parser().parse(avroSchemaV3Json) // Use new parser to avoid cache
 
-    // Create AvroData converters (like Schema Registry does)
-    // Each deserialization in production creates a new AvroData instance or uses cached one
-    val avroDataConfig = new AvroDataConfig(Map(
-      "enhanced.avro.schema.support" -> "true",
-      "schemas.cache.config"         -> "100",
-    ).asJava)
-
-    val avroDataV3 = new AvroData(avroDataConfig)
-    val avroDataV2 = new AvroData(avroDataConfig) // Separate instance to simulate different deserializations
+    val avroDataV3 = AvroDataFactory.create()
+    val avroDataV2 = AvroDataFactory.create() // Separate instance to simulate different deserialization
 
     // Convert Avro schemas to Connect schemas (this is what Schema Registry does)
     val connectSchemaV3 = avroDataV3.toConnectSchema(avroSchemaV3)