TileDB-Inc
diff --git a/‎src/include/detail/flat/qv.h‎
Lines changed: 47 additions & 33 deletions b/‎src/include/detail/flat/qv.h‎
Lines changed: 47 additions & 33 deletions
diff --git a/‎src/include/detail/flat/vq.h‎
Lines changed: 54 additions & 39 deletions b/‎src/include/detail/flat/vq.h‎
Lines changed: 54 additions & 39 deletions
@@ -73,10 +73,13 @@ namespace detail::flat {
  */
 template <class DB, class Q>
 [[deprecated]] auto qv_query_heap_0(
-    DB& db, const Q& q, int k_nn, unsigned int nthreads) {
+    const DB& db, const Q& q, int k_nn, unsigned int nthreads) {
   scoped_timer _{tdb_func__};
 
-  ColMajorMatrix<size_t> top_k(k_nn, size(q));
+  using id_type = size_t;
+  using score_type = float;
+
+  ColMajorMatrix<id_type> top_k(k_nn, size(q));
 
   auto par = stdx::execution::indexed_parallel_policy{nthreads};
   stdx::range_for_each(
@@ -85,7 +88,7 @@ template <class DB, class Q>
         size_t size_db = size(db);
 
         // @todo can we do this more efficiently?
-        Vector<float> scores(size_db);
+        Vector<score_type> scores(size_db);
 
         for (size_t i = 0; i < size_db; ++i) {
           scores[i] = L2(q_vec, db[i]);
@@ -113,40 +116,44 @@ template <class DB, class Q>
  * @return A matrix of size k x #queries containing the top k results for each
  * query.
  */
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto qv_query_heap(
     T,
-    DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const DB& db,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads);
 
 template <class DB, class Q>
-auto qv_query_heap(DB& db, Q& q, int k_nn, unsigned nthreads) {
+auto qv_query_heap(const DB& db, const Q& q, int k_nn, unsigned nthreads) {
   return qv_query_heap(
       without_ids{}, db, q, std::vector<size_t>{}, k_nn, nthreads);
 }
 
-template <class DB, class Q, class Index>
+template <class DB, class Q, class ID>
 auto qv_query_heap(
-    DB& db, Q& q, const std::vector<Index>& ids, int k_nn, unsigned nthreads) {
+    const DB& db, const Q& q, const ID& ids, int k_nn, unsigned nthreads) {
   return qv_query_heap(with_ids{}, db, q, ids, k_nn, nthreads);
 }
 
 // @todo Add to out of core
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto qv_query_heap(
     T,
-    DB& db,
-    Q& query,
-    const std::vector<Index>& ids,
+    const DB& db,
+    const Q& query,
+    const ID& ids,
     int k_nn,
     unsigned nthreads) {
   scoped_timer _{tdb_func__};
 
-  auto top_k = ColMajorMatrix<size_t>(k_nn, query.num_cols());
-  auto top_k_scores = ColMajorMatrix<float>(k_nn, query.num_cols());
+  // using feature_type = typename std::remove_reference_t<decltype(db)>::value_type;
+  using id_type = typename std::remove_reference_t<decltype(ids)>::value_type;
+  using score_type = float;
+
+  auto top_k = ColMajorMatrix<id_type>(k_nn, query.num_cols());
+  auto top_k_scores = ColMajorMatrix<score_type>(k_nn, query.num_cols());
 
   // Have to do explicit asynchronous threading here, as the current parallel
   // algorithms have iterator-based interaces, and the `Matrix` class does not
@@ -159,7 +166,7 @@ auto qv_query_heap(
       std::move(par),
       query,
       [&, size_db](auto&& q_vec, auto&& n = 0, auto&& j = 0) {
-        fixed_min_pair_heap<float, size_t> min_scores(k_nn);
+        fixed_min_pair_heap<score_type, id_type> min_scores(k_nn);
 
         for (size_t i = 0; i < size_db; ++i) {
           auto score = L2(q_vec, db[i]);
@@ -190,35 +197,40 @@ auto qv_query_heap(
  * @return A matrix of size k x #queries containing the top k results for each
  * query.
  */
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto qv_query_heap_tiled(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads);
 
 template <class DB, class Q>
-auto qv_query_heap_tiled(DB& db, Q& q, int k_nn, unsigned nthreads) {
+auto qv_query_heap_tiled(DB& db, const Q& q, int k_nn, unsigned nthreads) {
   return qv_query_heap_tiled(
       without_ids{}, db, q, std::vector<size_t>{}, k_nn, nthreads);
 }
 
-template <class DB, class Q, class Index>
+template <class DB, class Q, class ID>
 auto qv_query_heap_tiled(
-    DB& db, Q& q, const std::vector<Index>& ids, int k_nn, unsigned nthreads) {
+    DB& db, Q& q, const ID& ids, int k_nn, unsigned nthreads) {
   return qv_query_heap_tiled(with_ids{}, db, q, ids, k_nn, nthreads);
 }
 
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto qv_query_heap_tiled(
     T,
     DB& db,
-    Q& query,
-    [[maybe_unused]] const std::vector<Index>& ids,
+    const Q& query,
+    [[maybe_unused]] const ID& ids,
     int k_nn,
     unsigned nthreads) {
+  
+  // using feature_type = typename std::remove_reference_t<decltype(db)>::value_type;
+  using id_type = typename std::remove_reference_t<decltype(ids)>::value_type;
+  using score_type = float;
+  
   if constexpr (is_loadable_v<decltype(db)>) {
     db.load();
   }
@@ -236,8 +248,8 @@ auto qv_query_heap_tiled(
   std::vector<std::future<void>> futs;
   futs.reserve(nthreads);
 
-  auto min_scores = std::vector<fixed_min_pair_heap<float, size_t>>(
-      size(query), fixed_min_pair_heap<float, size_t>(k_nn));
+  auto min_scores = std::vector<fixed_min_pair_heap<score_type, id_type>>(
+      size(query), fixed_min_pair_heap<score_type, id_type>(k_nn));
 
   // @todo: Use range::for_each
   for (size_t n = 0; n < nthreads; ++n) {
@@ -251,8 +263,8 @@ auto qv_query_heap_tiled(
             auto len = 2 * ((stop - start) / 2);
             auto end = start + len;
 
-            // auto min_scores0 = fixed_min_pair_heap<float, size_t> (k);
-            // auto min_scores1 = fixed_min_pair_heap<float, size_t> (k);
+            // auto min_scores0 = fixed_min_pair_heap<score_type, id_type> (k);
+            // auto min_scores1 = fixed_min_pair_heap<score_type, id_type> (k);
 
             for (auto j = start; j != end; j += 2) {
               auto j0 = j + 0;
@@ -365,15 +377,17 @@ template <class DB, class Q>
 auto qv_partition(const DB& db, const Q& q, unsigned nthreads) {
   scoped_timer _{tdb_func__};
 
+  // Just need a single vector -- creating an index, not ids, so hardcoded size_t is okay to use here
+  using id_type = size_t;
+  using score_type = float;
   auto size_db = size(db);
 
-  // Just need a single vector
-  std::vector<size_t> top_k(q.num_cols());
+  std::vector<id_type> top_k(q.num_cols());
 
   auto par = stdx::execution::indexed_parallel_policy{(size_t)nthreads};
   stdx::range_for_each(
       std::move(par), q, [&, size_db](auto&& qvec, auto&& n = 0, auto&& j = 0) {
-        float min_score = std::numeric_limits<float>::max();
+        score_type min_score = std::numeric_limits<score_type>::max();
         size_t idx = 0;
 
         for (size_t i = 0; i < size_db; ++i) {
 
@@ -51,42 +51,47 @@ namespace detail::flat {
  *
  * @todo Unify out of core and not out of core versions.
  */
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto vq_query_heap(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads);
 
 template <class DB, class Q>
-auto vq_query_heap(DB& db, Q& q, int k_nn, unsigned nthreads) {
+auto vq_query_heap(DB& db, const Q& q, int k_nn, unsigned nthreads) {
   return vq_query_heap(
       without_ids{}, db, q, std::vector<size_t>{}, k_nn, nthreads);
 }
 
-template <class DB, class Q, class Index>
+template <class DB, class Q, class ID>
 auto vq_query_heap(
-    DB& db, Q& q, const std::vector<Index>& ids, int k_nn, unsigned nthreads) {
+    DB& db, const Q& q, const ID& ids, int k_nn, unsigned nthreads) {
   return vq_query_heap(with_ids{}, db, q, ids, k_nn, nthreads);
 }
 
 // @todo Support out of core
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto vq_query_heap(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads) {
   // @todo Need to get the total number of queries, not just the first block
   // @todo Use Matrix here rather than vector of vectors
-  std::vector<std::vector<fixed_min_pair_heap<float, Index>>> scores(
+  
+  // using feature_type = typename std::remove_reference_t<decltype(db)>::value_type;
+  using id_type = typename std::remove_reference_t<decltype(ids)>::value_type;
+  using score_type = float;
+  
+  std::vector<std::vector<fixed_min_pair_heap<score_type, id_type>>> scores(
       nthreads,
-      std::vector<fixed_min_pair_heap<float, Index>>(
-          size(q), fixed_min_pair_heap<float, Index>(k_nn)));
+      std::vector<fixed_min_pair_heap<score_type, id_type>>(
+          size(q), fixed_min_pair_heap<score_type, id_type>(k_nn)));
 
   unsigned size_q = size(q);
   auto par = stdx::execution::indexed_parallel_policy{nthreads};
@@ -138,7 +143,7 @@ auto vq_query_heap(
   }
 
   consolidate_scores(scores);
-  auto top_k = get_top_k_with_scores<fixed_min_pair_heap<float, Index>, Index>(scores, k_nn);
+  auto top_k = get_top_k_with_scores(scores, k_nn);
 
   return top_k;
 }
@@ -153,41 +158,46 @@ auto vq_query_heap(
  * @param nthreads
  * @return
  */
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto vq_query_heap_tiled(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads);
 
 template <class DB, class Q>
-auto vq_query_heap_tiled(DB& db, Q& q, int k_nn, unsigned nthreads) {
+auto vq_query_heap_tiled(DB& db, const Q& q, int k_nn, unsigned nthreads) {
   return vq_query_heap_tiled(
       without_ids{}, db, q, std::vector<size_t>{}, k_nn, nthreads);
 }
 
-template <class DB, class Q, class Index>
+template <class DB, class Q, class ID>
 auto vq_query_heap_tiled(
-    DB& db, Q& q, const std::vector<Index>& ids, int k_nn, unsigned nthreads) {
+    DB& db, const Q& q, const ID& ids, int k_nn, unsigned nthreads) {
   return vq_query_heap_tiled(with_ids{}, db, q, ids, k_nn, nthreads);
 }
 
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto vq_query_heap_tiled(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads) {
   // @todo Need to get the total number of queries, not just the first block
   // @todo Use Matrix here rather than vector of vectors
-  std::vector<std::vector<fixed_min_pair_heap<float, Index>>> scores(
+  
+  // using feature_type = typename std::remove_reference_t<decltype(db)>::value_type;
+  using id_type = typename std::remove_reference_t<decltype(ids)>::value_type;
+  using score_type = float;
+  
+  std::vector<std::vector<fixed_min_pair_heap<score_type, id_type>>> scores(
       nthreads,
-      std::vector<fixed_min_pair_heap<float, Index>>(
-          size(q), fixed_min_pair_heap<float, Index>(k_nn)));
+      std::vector<fixed_min_pair_heap<score_type, id_type>>(
+          size(q), fixed_min_pair_heap<score_type, id_type>(k_nn)));
 
   unsigned size_q = size(q);
   auto par = stdx::execution::indexed_parallel_policy{nthreads};
@@ -223,48 +233,53 @@ auto vq_query_heap_tiled(
   } while (load(db));
 
   consolidate_scores(scores);
-  auto top_k = get_top_k_with_scores<fixed_min_pair_heap<float, Index>, Index>(scores, k_nn);
+  auto top_k = get_top_k_with_scores(scores, k_nn);
 
   return top_k;
 }
 
 // ====================================================================================================
 
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto vq_query_heap_2(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads);
 
 template <class DB, class Q>
-auto vq_query_heap_2(DB& db, Q& q, int k_nn, unsigned nthreads) {
+auto vq_query_heap_2(DB& db, const Q& q, int k_nn, unsigned nthreads) {
   return vq_query_heap_2(
       without_ids{}, db, q, std::vector<size_t>{}, k_nn, nthreads);
 }
 
-template <class DB, class Q, class Index>
+template <class DB, class Q, class ID>
 auto vq_query_heap_2(
-    DB& db, Q& q, const std::vector<Index>& ids, int k_nn, unsigned nthreads) {
+    DB& db, const Q& q, const ID& ids, int k_nn, unsigned nthreads) {
   return vq_query_heap_2(with_ids{}, db, q, ids, k_nn, nthreads);
 }
 
-template <class T, class DB, class Q, class Index>
+template <class T, class DB, class Q, class ID>
 auto vq_query_heap_2(
     T,
     DB& db,
-    Q& q,
-    const std::vector<Index>& ids,
+    const Q& q,
+    const ID& ids,
     int k_nn,
     unsigned nthreads) {
   // @todo Need to get the total number of queries, not just the first block
   // @todo Use Matrix here rather than vector of vectors
-  std::vector<std::vector<fixed_min_pair_heap<float, Index>>> scores(
+
+  // using feature_type = typename std::remove_reference_t<decltype(db)>::value_type;
+  using id_type = typename std::remove_reference_t<decltype(ids)>::value_type;
+  using score_type = float;
+
+  std::vector<std::vector<fixed_min_pair_heap<score_type, id_type>>> scores(
       nthreads,
-      std::vector<fixed_min_pair_heap<float, Index>>(
-          size(q), fixed_min_pair_heap<float, Index>(k_nn)));
+      std::vector<fixed_min_pair_heap<score_type, id_type>>(
+          size(q), fixed_min_pair_heap<score_type, id_type>(k_nn)));
 
   unsigned size_q = size(q);
   auto par = stdx::execution::indexed_parallel_policy{nthreads};
@@ -300,7 +315,7 @@ auto vq_query_heap_2(
   } while (load(db));
 
   consolidate_scores(scores);
-  auto top_k = get_top_k_with_scores<fixed_min_pair_heap<float, Index>, Index>(scores, k_nn);
+  auto top_k = get_top_k_with_scores(scores, k_nn);
 
   return top_k;
 }