more precise schema compatibility check

yatharthranjan · yatharthranjan · commit d5fbd9417dc9 · 2018-04-25T15:57:40.000+01:00
diff --git a/src/main/java/org/radarcns/util/CsvAvroConverter.java b/src/main/java/org/radarcns/util/CsvAvroConverter.java
@@ -16,6 +16,7 @@
 
 package org.radarcns.util;
 
+import com.fasterxml.jackson.databind.JsonMappingException;
 import com.fasterxml.jackson.databind.MappingIterator;
 import com.fasterxml.jackson.databind.ObjectReader;
 import com.fasterxml.jackson.databind.ObjectWriter;
@@ -33,9 +34,7 @@
 import java.io.Reader;
 import java.io.Writer;
 import java.nio.ByteBuffer;
-import java.util.LinkedHashMap;
-import java.util.List;
-import java.util.Map;
+import java.util.*;
 
 /**
  * Converts deep hierarchical Avro records into flat CSV format. It uses a simple dot syntax in the
@@ -62,7 +61,7 @@ public boolean hasHeader() {
     private final ObjectWriter csvWriter;
     private final Map<String, Object> map;
     private final CsvGenerator generator;
-    private final int numOfColumns;
+    private CsvSchema schema;
 
     public CsvAvroConverter(CsvFactory factory, Writer writer, GenericRecord record, boolean writeHeader, Reader reader)
             throws IOException {
@@ -71,7 +70,7 @@ public CsvAvroConverter(CsvFactory factory, Writer writer, GenericRecord record,
         CsvMapper mapper = new CsvMapper(factory);
         Map<String, Object> value;
 
-        CsvSchema schema = CsvSchema.emptySchema().withHeader();
+        schema = CsvSchema.emptySchema().withHeader();
         if (!writeHeader) {
             // If file already exists read the schema from the CSV file
             ObjectReader objectReader = mapper.readerFor(Map.class).with(schema);
@@ -93,7 +92,6 @@ public CsvAvroConverter(CsvFactory factory, Writer writer, GenericRecord record,
 
         generator = factory.createGenerator(writer);
         csvWriter = mapper.writer(schema);
-        numOfColumns = schema.size();
 
     }
 
@@ -107,10 +105,21 @@ public CsvAvroConverter(CsvFactory factory, Writer writer, GenericRecord record,
     public boolean writeRecord(GenericRecord record) throws IOException {
         Map<String, Object> localMap = convertRecord(record);
 
-        if(localMap.size() > numOfColumns) {
+        if(localMap.size() > schema.size()) {
             // Cannot write to same file so return false
             return false;
+        } else {
+            Iterator<String> localColumnIterator = localMap.keySet().iterator();
+            for(int i = 0; i < schema.size(); i++) {
+                if (!schema.columnName(i).equals(localColumnIterator.next())) {
+                    /* The order or name of columns is different and
+                    thus cannot write to this csv file. return false.
+                     */
+                    return false;
+                }
+            }
         }
+
         csvWriter.writeValue(generator, localMap);
         localMap.clear();
         return true;
diff --git a/src/test/java/org/radarcns/util/CsvAvroConverterTest.java b/src/test/java/org/radarcns/util/CsvAvroConverterTest.java
@@ -116,8 +116,31 @@ public void differentSchema() throws IOException {
         Schema schemaB = SchemaBuilder.record("B").fields().name("b").type("string").noDefault().endRecord();
         GenericRecord recordB = new GenericRecordBuilder(schemaB).set("b", "something").build();
 
-        exception.expect(JsonMappingException.class);
-        converter.writeRecord(recordB);
+        /* Same number of columns but different schema, so CsvAvroConverter.write() will return false
+        signifying that a new CSV file must be used to write this record
+         */
+        assertFalse(converter.writeRecord(recordB));
+        System.out.println(writer.toString());
+    }
+
+
+    @Test
+    public void differentSchema2() throws IOException {
+        Schema schemaA = SchemaBuilder.record("A").fields().name("a").type("string").noDefault().name("b").type("string").noDefault().endRecord();
+        GenericRecord recordA = new GenericRecordBuilder(schemaA).set("a", "something").set("b", "2nd something").build();
+
+        StringWriter writer = new StringWriter();
+        RecordConverter converter = CsvAvroConverter.getFactory().converterFor(writer, recordA, true, new StringReader("test"));
+        converter.writeRecord(recordA);
+
+        Schema schemaB = SchemaBuilder.record("B").fields().name("b").type("string").noDefault().name("a").type("string").noDefault().endRecord();
+        GenericRecord recordB = new GenericRecordBuilder(schemaB).set("b", "something").set("a", "2nd something").build();
+
+        /* Same number of columns and same header but different order,
+        so CsvAvroConverter.write() will return false signifying that
+        a new CSV file must be used to write this record
+         */
+        assertFalse(converter.writeRecord(recordB));
         System.out.println(writer.toString());
     }