devinrsmith
diff --git a/‎Util/src/main/java/io/deephaven/util/annotations/InternalUseOnly.java‎
Lines changed: 4 additions & 3 deletions b/‎Util/src/main/java/io/deephaven/util/annotations/InternalUseOnly.java‎
Lines changed: 4 additions & 3 deletions
diff --git a/‎extensions/iceberg/src/test/java/io/deephaven/iceberg/junit5/SqliteCatalogBase.java‎
Lines changed: 27 additions & 27 deletions b/‎extensions/iceberg/src/test/java/io/deephaven/iceberg/junit5/SqliteCatalogBase.java‎
Lines changed: 27 additions & 27 deletions
diff --git a/‎extensions/parquet/base/build.gradle‎
Lines changed: 12 additions & 1 deletion b/‎extensions/parquet/base/build.gradle‎
Lines changed: 12 additions & 1 deletion
diff --git a/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/base/ColumnChunkReaderImpl.java‎
Lines changed: 2 additions & 2 deletions b/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/base/ColumnChunkReaderImpl.java‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/base/ColumnWriterImpl.java‎
Lines changed: 5 additions & 4 deletions b/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/base/ColumnWriterImpl.java‎
Lines changed: 5 additions & 4 deletions
diff --git a/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/base/RowGroupWriterImpl.java‎
Lines changed: 8 additions & 6 deletions b/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/base/RowGroupWriterImpl.java‎
Lines changed: 8 additions & 6 deletions
diff --git a/‎…et/table/location/ParquetSchemaUtil.java‎ ‎…aven/parquet/impl/ParquetSchemaUtil.java‎extensions/parquet/table/src/main/java/io/deephaven/parquet/table/location/ParquetSchemaUtil.java renamed to extensions/parquet/base/src/main/java/io/deephaven/parquet/impl/ParquetSchemaUtil.java
Lines changed: 35 additions & 12 deletions b/‎…et/table/location/ParquetSchemaUtil.java‎ ‎…aven/parquet/impl/ParquetSchemaUtil.java‎extensions/parquet/table/src/main/java/io/deephaven/parquet/table/location/ParquetSchemaUtil.java renamed to extensions/parquet/base/src/main/java/io/deephaven/parquet/impl/ParquetSchemaUtil.java
Lines changed: 35 additions & 12 deletions
diff --git a/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/impl/package-info.java‎
Lines changed: 4 additions & 0 deletions b/‎extensions/parquet/base/src/main/java/io/deephaven/parquet/impl/package-info.java‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎extensions/parquet/base/src/test/java/io/deephaven/parquet/base/TestParquetTimeUtils.java‎
Lines changed: 16 additions & 15 deletions b/‎extensions/parquet/base/src/test/java/io/deephaven/parquet/base/TestParquetTimeUtils.java‎
Lines changed: 16 additions & 15 deletions
@@ -9,10 +9,11 @@
 import java.lang.annotation.Target;
 
 /**
- * Indicates that a particular method is for internal use only and should not be used by client code. It is subject to
- * change/removal at any time.
+ * Indicates that a particular {@link ElementType#METHOD method}, {@link ElementType#CONSTRUCTOR constructor},
+ * {@link ElementType#TYPE type}, or {@link ElementType#PACKAGE package} is for internal use only and should not be used
+ * by client code. It is subject to change/removal at any time.
  */
-@Target({ElementType.METHOD, ElementType.CONSTRUCTOR, ElementType.TYPE})
+@Target({ElementType.METHOD, ElementType.CONSTRUCTOR, ElementType.TYPE, ElementType.PACKAGE})
 @Inherited
 @Documented
 public @interface InternalUseOnly {
 
@@ -34,8 +34,9 @@
 import org.apache.iceberg.catalog.Namespace;
 import org.apache.iceberg.catalog.TableIdentifier;
 import org.apache.iceberg.types.Types;
-import org.apache.parquet.column.ColumnDescriptor;
 import org.apache.parquet.hadoop.metadata.ParquetMetadata;
+import org.apache.parquet.schema.LogicalTypeAnnotation;
+import org.apache.parquet.schema.MessageType;
 import org.jetbrains.annotations.Nullable;
 import org.junit.jupiter.api.AfterEach;
 import org.junit.jupiter.api.BeforeEach;
@@ -53,6 +54,11 @@
 import java.util.List;
 import java.util.stream.Collectors;
 import static io.deephaven.engine.testutil.TstUtils.assertTableEquals;
+import static org.apache.parquet.schema.LogicalTypeAnnotation.intType;
+import static org.apache.parquet.schema.PrimitiveType.PrimitiveTypeName.DOUBLE;
+import static org.apache.parquet.schema.PrimitiveType.PrimitiveTypeName.INT32;
+import static org.apache.parquet.schema.Types.buildMessage;
+import static org.apache.parquet.schema.Types.optional;
 import static org.assertj.core.api.Assertions.assertThat;
 import static org.assertj.core.api.Assertions.failBecauseExceptionWasNotThrown;
 
@@ -416,8 +422,12 @@ void testColumnRenameWhileWriting() throws URISyntaxException {
         {
             final List<String> parquetFiles = getAllParquetFilesFromDataFiles(tableIdentifier);
             assertThat(parquetFiles).hasSize(1);
-            verifyFieldIdsFromParquetFile(parquetFiles.get(0), originalDefinition.getColumnNames(),
-                    nameToFieldIdFromSchema);
+            final MessageType expectedSchema = buildMessage()
+                    .addFields(
+                            optional(INT32).id(1).as(intType(32, true)).named("intCol"),
+                            optional(DOUBLE).id(2).named("doubleCol"))
+                    .named("root");
+            verifySchema(parquetFiles.get(0), expectedSchema);
         }
 
         final Table moreData = TableTools.emptyTable(5)
@@ -442,10 +452,18 @@ void testColumnRenameWhileWriting() throws URISyntaxException {
 
             final List<String> parquetFiles = getAllParquetFilesFromDataFiles(tableIdentifier);
             assertThat(parquetFiles).hasSize(2);
-            verifyFieldIdsFromParquetFile(parquetFiles.get(0), moreData.getDefinition().getColumnNames(),
-                    newNameToFieldId);
-            verifyFieldIdsFromParquetFile(parquetFiles.get(1), originalDefinition.getColumnNames(),
-                    nameToFieldIdFromSchema);
+            final MessageType expectedSchema0 = buildMessage()
+                    .addFields(
+                            optional(INT32).id(1).as(intType(32, true)).named("newIntCol"),
+                            optional(DOUBLE).id(2).named("newDoubleCol"))
+                    .named("root");
+            final MessageType expectedSchema1 = buildMessage()
+                    .addFields(
+                            optional(INT32).id(1).as(intType(32, true)).named("intCol"),
+                            optional(DOUBLE).id(2).named("doubleCol"))
+                    .named("root");
+            verifySchema(parquetFiles.get(0), expectedSchema0);
+            verifySchema(parquetFiles.get(1), expectedSchema1);
         }
 
         // TODO: This is failing because we don't map columns based on the column ID when reading. Uncomment this
@@ -455,31 +473,13 @@ void testColumnRenameWhileWriting() throws URISyntaxException {
         // moreData.renameColumns("intCol = newIntCol", "doubleCol = newDoubleCol")), fromIceberg);
     }
 
-    /**
-     * Verify that the schema of the parquet file read from the provided path has the provided column and corresponding
-     * field IDs.
-     */
-    private void verifyFieldIdsFromParquetFile(
-            final String path,
-            final List<String> columnNames,
-            final Map<String, Integer> nameToFieldId) throws URISyntaxException {
+    private void verifySchema(String path, MessageType expectedSchema) throws URISyntaxException {
         final ParquetMetadata metadata =
                 new ParquetTableLocationKey(new URI(path), 0, null, ParquetInstructions.builder()
                         .setSpecialInstructions(dataInstructions())
                         .build())
                         .getMetadata();
-        final List<ColumnDescriptor> columnsMetadata = metadata.getFileMetaData().getSchema().getColumns();
-
-        final int numColumns = columnNames.size();
-        for (int colIdx = 0; colIdx < numColumns; colIdx++) {
-            final String columnName = columnNames.get(colIdx);
-            final String columnNameFromParquetFile = columnsMetadata.get(colIdx).getPath()[0];
-            assertThat(columnName).isEqualTo(columnNameFromParquetFile);
-
-            final int expectedFieldId = nameToFieldId.get(columnName);
-            final int fieldIdFromParquetFile = columnsMetadata.get(colIdx).getPrimitiveType().getId().intValue();
-            assertThat(fieldIdFromParquetFile).isEqualTo(expectedFieldId);
-        }
+        assertThat(metadata.getFileMetaData().getSchema()).isEqualTo(expectedSchema);
     }
 
     /**
 
@@ -22,5 +22,16 @@ dependencies {
     implementation libs.guava
 
     compileOnly libs.jetbrains.annotations
-    testImplementation libs.junit4
+
+    testImplementation libs.assertj
+
+    testImplementation platform(libs.junit.bom)
+    testImplementation libs.junit.jupiter
+    testRuntimeOnly libs.junit.jupiter.engine
+    testRuntimeOnly libs.junit.platform.launcher
+}
+
+tasks.withType(Test).configureEach {
+    useJUnitPlatform {
+    }
 }
@@ -4,6 +4,7 @@
 package io.deephaven.parquet.base;
 
 import io.deephaven.UncheckedDeephavenException;
+import io.deephaven.parquet.impl.ParquetSchemaUtil;
 import io.deephaven.util.channel.SeekableChannelContext;
 import io.deephaven.util.channel.SeekableChannelsProvider;
 import io.deephaven.parquet.compress.CompressorAdapter;
@@ -68,8 +69,7 @@ final class ColumnChunkReaderImpl implements ColumnChunkReader {
         this.columnName = columnName;
         this.channelsProvider = channelsProvider;
         this.columnChunk = columnChunk;
-        this.path = type
-                .getColumnDescription(columnChunk.meta_data.getPath_in_schema().toArray(new String[0]));
+        this.path = ParquetSchemaUtil.getColumnDescriptor(type, columnChunk.meta_data.getPath_in_schema());
         if (columnChunk.getMeta_data().isSetCodec()) {
             decompressor = DeephavenCompressorAdapterFactory.getInstance()
                     .getByName(columnChunk.getMeta_data().getCodec().name());
 
@@ -32,6 +32,7 @@
 import java.nio.channels.Channels;
 import java.nio.channels.WritableByteChannel;
 import java.util.EnumSet;
+import java.util.Objects;
 import java.util.Set;
 
 import static org.apache.parquet.bytes.BytesUtils.getWidthFromMaxInt;
@@ -76,11 +77,11 @@ final class ColumnWriterImpl implements ColumnWriter {
             final CompressorAdapter compressorAdapter,
             final int targetPageSize,
             final ByteBufferAllocator allocator) {
-        this.countingOutput = countingOutput;
-        this.column = column;
-        this.compressorAdapter = compressorAdapter;
+        this.countingOutput = Objects.requireNonNull(countingOutput);
+        this.column = Objects.requireNonNull(column);
+        this.compressorAdapter = Objects.requireNonNull(compressorAdapter);
         this.targetPageSize = targetPageSize;
-        this.allocator = allocator;
+        this.allocator = Objects.requireNonNull(allocator);
         dlEncoder = column.getMaxDefinitionLevel() == 0 ? null
                 : new RunLengthBitPackingHybridEncoder(
                         getWidthFromMaxInt(column.getMaxDefinitionLevel()), MIN_SLAB_SIZE, targetPageSize, allocator);
 
@@ -5,6 +5,7 @@
 
 import com.google.common.io.CountingOutputStream;
 import io.deephaven.parquet.compress.CompressorAdapter;
+import io.deephaven.parquet.impl.ParquetSchemaUtil;
 import org.apache.parquet.bytes.ByteBufferAllocator;
 import org.apache.parquet.hadoop.metadata.BlockMetaData;
 import org.apache.parquet.hadoop.metadata.ColumnChunkMetaData;
@@ -16,6 +17,7 @@
 import java.util.ArrayList;
 import java.util.Arrays;
 import java.util.List;
+import java.util.Objects;
 
 final class RowGroupWriterImpl implements RowGroupWriter {
     private final CountingOutputStream countingOutput;
@@ -42,12 +44,12 @@ private RowGroupWriterImpl(CountingOutputStream countingOutput,
             ByteBufferAllocator allocator,
             BlockMetaData blockMetaData,
             CompressorAdapter compressorAdapter) {
-        this.countingOutput = countingOutput;
-        this.type = type;
+        this.countingOutput = Objects.requireNonNull(countingOutput);
+        this.type = Objects.requireNonNull(type);
         this.targetPageSize = targetPageSize;
-        this.allocator = allocator;
-        this.blockMetaData = blockMetaData;
-        this.compressorAdapter = compressorAdapter;
+        this.allocator = Objects.requireNonNull(allocator);
+        this.blockMetaData = Objects.requireNonNull(blockMetaData);
+        this.compressorAdapter = Objects.requireNonNull(compressorAdapter);
     }
 
     String[] getPrimitivePath(String columnName) {
@@ -74,7 +76,7 @@ public ColumnWriter addColumn(String columnName) {
         }
         activeWriter = new ColumnWriterImpl(this,
                 countingOutput,
-                type.getColumnDescription(getPrimitivePath(columnName)),
+                ParquetSchemaUtil.getColumnDescriptor(type, getPrimitivePath(columnName)),
                 compressorAdapter,
                 targetPageSize,
                 allocator);
 
@@ -1,7 +1,7 @@
 //
 // Copyright (c) 2016-2024 Deephaven Data Labs and Patent Pending
 //
-package io.deephaven.parquet.table.location;
+package io.deephaven.parquet.impl;
 
 import io.deephaven.base.verify.Assert;
 import org.apache.parquet.column.ColumnDescriptor;
@@ -20,9 +20,12 @@
 import java.util.function.Consumer;
 import java.util.function.Predicate;
 
-final class ParquetSchemaUtil {
+/**
+ * Various improved ways of traversing {@link MessageType}.
+ */
+public final class ParquetSchemaUtil {
 
-    interface Visitor {
+    public interface Visitor {
 
         /**
          * Accept a Parquet column.
@@ -43,27 +46,36 @@ interface Visitor {
     /**
      * A more efficient implementation of {@link MessageType#getColumns()}.
      */
-    static List<ColumnDescriptor> getColumns(MessageType schema) {
+    public static List<ColumnDescriptor> getColumns(MessageType schema) {
         final List<ColumnDescriptor> out = new ArrayList<>();
         walkColumnDescriptors(schema, out::add);
         return out;
     }
 
-    static void walkColumnDescriptors(MessageType type, Consumer<ColumnDescriptor> consumer) {
+    /**
+     * A more efficient implementation of {@link MessageType#getPaths()}.
+     */
+    public static List<String[]> getPaths(MessageType schema) {
+        final List<String[]> out = new ArrayList<>();
+        walk(schema, (path, primitiveType) -> out.add(makeNamePath(path)));
+        return out;
+    }
+
+    public static void walkColumnDescriptors(MessageType type, Consumer<ColumnDescriptor> consumer) {
         walk(type, new ColumnDescriptorVisitor(consumer));
     }
 
     /**
      * An alternative interface for traversing the leaf fields of a Parquet schema.
      */
-    static void walk(MessageType type, Visitor visitor) {
+    public static void walk(MessageType type, Visitor visitor) {
         walk(type, visitor, new ArrayDeque<>());
     }
 
     /**
-     * A more efficient implementation of {@link MessageType#getColumnDescription(String[])}
+     * A more efficient implementation of {@link MessageType#getColumnDescription(String[])}.
      */
-    static ColumnDescriptor getColumnDescriptor(MessageType schema, String[] path) {
+    public static ColumnDescriptor getColumnDescriptor(MessageType schema, String[] path) {
         if (path.length == 0) {
             return null;
         }
@@ -106,28 +118,39 @@ static ColumnDescriptor getColumnDescriptor(MessageType schema, String[] path) {
         return new ColumnDescriptor(path, primitiveType, repeatedCount, notRequiredCount);
     }
 
-    static ColumnDescriptor makeColumnDescriptor(Collection<Type> path, PrimitiveType primitiveType) {
-        final String[] namePath = path.stream().map(Type::getName).toArray(String[]::new);
+    /**
+     * A more efficient implementation of {@link MessageType#getColumnDescription(String[])}.
+     */
+    public static ColumnDescriptor getColumnDescriptor(MessageType schema, List<String> path) {
+        return getColumnDescriptor(schema, path.toArray(new String[0]));
+    }
+
+    public static ColumnDescriptor makeColumnDescriptor(Collection<Type> path, PrimitiveType primitiveType) {
+        final String[] namePath = makeNamePath(path);
         final int maxRep = (int) path.stream().filter(ParquetSchemaUtil::isRepeated).count();
         final int maxDef = (int) path.stream().filter(Predicate.not(ParquetSchemaUtil::isRequired)).count();
         return new ColumnDescriptor(namePath, primitiveType, maxRep, maxDef);
     }
 
-    static boolean columnDescriptorEquals(ColumnDescriptor a, ColumnDescriptor b) {
+    public static boolean columnDescriptorEquals(ColumnDescriptor a, ColumnDescriptor b) {
         return a.equals(b)
                 && a.getPrimitiveType().equals(b.getPrimitiveType())
                 && a.getMaxRepetitionLevel() == b.getMaxRepetitionLevel()
                 && a.getMaxDefinitionLevel() == b.getMaxDefinitionLevel();
     }
 
-    static boolean contains(MessageType schema, ColumnDescriptor descriptor) {
+    public static boolean contains(MessageType schema, ColumnDescriptor descriptor) {
         final ColumnDescriptor cd = getColumnDescriptor(schema, descriptor.getPath());
         if (cd == null) {
             return false;
         }
         return columnDescriptorEquals(descriptor, cd);
     }
 
+    private static String[] makeNamePath(Collection<Type> path) {
+        return path.stream().map(Type::getName).toArray(String[]::new);
+    }
+
     private static void walk(Type type, Visitor visitor, Deque<Type> stack) {
         if (type.isPrimitive()) {
             visitor.accept(stack, type.asPrimitiveType());
 
@@ -0,0 +1,4 @@
+@InternalUseOnly
+package io.deephaven.parquet.impl;
+
+import io.deephaven.util.annotations.InternalUseOnly;
@@ -5,52 +5,53 @@
 
 import io.deephaven.time.DateTimeUtils;
 import io.deephaven.util.QueryConstants;
-import junit.framework.TestCase;
-import org.junit.Test;
+import org.junit.jupiter.api.Test;
 
 import java.time.Instant;
 import java.time.LocalDateTime;
 import java.time.ZoneId;
 
-public class TestParquetTimeUtils {
+import static org.assertj.core.api.AssertionsForClassTypes.assertThat;
+
+class TestParquetTimeUtils {
 
     @Test
-    public void testEpochNanosUTC() {
+    void testEpochNanosUTC() {
         final long nanos = 123456789123456789L;
         final Instant dt2 = Instant.ofEpochSecond(0, nanos);
         final LocalDateTime ldt = LocalDateTime.ofInstant(dt2, ZoneId.of("UTC"));
-        TestCase.assertEquals(nanos, ParquetTimeUtils.epochNanosUTC(ldt));
-        TestCase.assertEquals(QueryConstants.NULL_LONG, ParquetTimeUtils.epochNanosUTC(null));
+        assertThat(ParquetTimeUtils.epochNanosUTC(ldt)).isEqualTo(nanos);
+        assertThat(ParquetTimeUtils.epochNanosUTC(null)).isEqualTo(QueryConstants.NULL_LONG);
     }
 
     @Test
-    public void testEpochNanosTo() {
+    void testEpochNanosTo() {
         final long nanos = 123456789123456789L;
         final Instant dt2 = Instant.ofEpochSecond(0, nanos);
         final LocalDateTime ldt = LocalDateTime.ofInstant(dt2, ZoneId.of("UTC"));
-        TestCase.assertEquals(ldt, ParquetTimeUtils.epochNanosToLocalDateTimeUTC(nanos));
-        TestCase.assertNull(ParquetTimeUtils.epochNanosToLocalDateTimeUTC(QueryConstants.NULL_LONG));
+        assertThat(ParquetTimeUtils.epochNanosToLocalDateTimeUTC(nanos)).isEqualTo(ldt);
+        assertThat(ParquetTimeUtils.epochNanosToLocalDateTimeUTC(QueryConstants.NULL_LONG)).isNull();
     }
 
     @Test
-    public void testEpochMicrosTo() {
+    void testEpochMicrosTo() {
         long nanos = 123456789123456789L;
         final long micros = DateTimeUtils.nanosToMicros(nanos);
         nanos = DateTimeUtils.microsToNanos(micros);
         final Instant dt2 = Instant.ofEpochSecond(0, nanos);
         final LocalDateTime ldt = LocalDateTime.ofInstant(dt2, ZoneId.of("UTC"));
-        TestCase.assertEquals(ldt, ParquetTimeUtils.epochMicrosToLocalDateTimeUTC(micros));
-        TestCase.assertNull(ParquetTimeUtils.epochMicrosToLocalDateTimeUTC(QueryConstants.NULL_LONG));
+        assertThat(ParquetTimeUtils.epochMicrosToLocalDateTimeUTC(micros)).isEqualTo(ldt);
+        assertThat(ParquetTimeUtils.epochMicrosToLocalDateTimeUTC(QueryConstants.NULL_LONG)).isNull();
     }
 
     @Test
-    public void testEpochMillisTo() {
+    void testEpochMillisTo() {
         long nanos = 123456789123456789L;
         final long millis = DateTimeUtils.nanosToMillis(nanos);
         nanos = DateTimeUtils.millisToNanos(millis);
         final Instant dt2 = Instant.ofEpochSecond(0, nanos);
         final LocalDateTime ldt = LocalDateTime.ofInstant(dt2, ZoneId.of("UTC"));
-        TestCase.assertEquals(ldt, ParquetTimeUtils.epochMillisToLocalDateTimeUTC(millis));
-        TestCase.assertNull(ParquetTimeUtils.epochMillisToLocalDateTimeUTC(QueryConstants.NULL_LONG));
+        assertThat(ParquetTimeUtils.epochMillisToLocalDateTimeUTC(millis)).isEqualTo(ldt);
+        assertThat(ParquetTimeUtils.epochMillisToLocalDateTimeUTC(QueryConstants.NULL_LONG)).isNull();
     }
 }