revert to using FILE *

JohannesGaessler · JohannesGaessler · commit 5d2a3930aa09 · 2025-01-03T00:32:33.000+01:00
diff --git a/ggml/src/ggml-impl.h b/ggml/src/ggml-impl.h
@@ -558,10 +558,10 @@ static inline ggml_bf16_t ggml_compute_fp32_to_bf16(float s) {
 #endif
 
 #ifdef __cplusplus
-#include <iostream>
+#include <vector>
 
 // expose GGUF internals for test code
 GGML_API size_t gguf_type_size(enum gguf_type type);
-GGML_API struct gguf_context * gguf_init_from_file_impl(std::istream & is, struct gguf_init_params params);
-GGML_API void gguf_write_to_buf(const struct gguf_context * ctx, std::ostream & os, bool only_meta);
+GGML_API struct gguf_context * gguf_init_from_file_impl(FILE * file, struct gguf_init_params params);
+GGML_API void gguf_write_to_buf(const struct gguf_context * ctx, std::vector<int8_t> & buf, bool only_meta);
 #endif // __cplusplus
diff --git a/ggml/src/gguf.cpp b/ggml/src/gguf.cpp
@@ -9,8 +9,6 @@
 #include <cstdio>
 #include <cstdlib>
 #include <cstring>
-#include <fstream>
-#include <iostream>
 #include <map>
 #include <new>
 #include <sstream>
@@ -220,14 +218,13 @@ struct gguf_context {
 };
 
 struct gguf_reader {
-    std::istream & is;
+    FILE * file;
 
-    gguf_reader(std::istream & is) : is(is) {}
+    gguf_reader(FILE * file) : file(file) {}
 
     template <typename T>
     bool read(T & dst) {
-        is.read(reinterpret_cast<char *>(&dst), sizeof(dst));
-        return is.good();
+        return fread(&dst, 1, sizeof(dst), file) == sizeof(dst);
     }
 
     template <typename T>
@@ -246,7 +243,7 @@ struct gguf_reader {
                 }
             }
         }
-        return is.good();
+        return true;
     }
 
     bool read(bool & dst) {
@@ -255,7 +252,7 @@ struct gguf_reader {
             return false;
         }
         dst = tmp != 0;
-        return is.good();
+        return true;
     }
 
     bool read(enum ggml_type & dst) {
@@ -264,7 +261,7 @@ struct gguf_reader {
             return false;
         }
         dst = ggml_type(tmp);
-        return is.good();
+        return true;
     }
 
     bool read(enum gguf_type & dst) {
@@ -273,7 +270,7 @@ struct gguf_reader {
             return false;
         }
         dst = gguf_type(tmp);
-        return is.good();
+        return true;
     }
 
     bool read(std::string & dst) {
@@ -282,13 +279,11 @@ struct gguf_reader {
             return false;
         }
         dst.resize(size);
-        is.read(dst.data(), dst.length());
-        return is.good();
+        return fread(dst.data(), 1, dst.length(), file) == dst.length();
     }
 
     bool read(void * dst, const size_t size) {
-        is.read(reinterpret_cast<char *>(dst), size);
-        return is.good();
+        return fread(dst, 1, size, file) == size;
     }
 };
 
@@ -322,8 +317,8 @@ bool gguf_read_emplace_helper(struct gguf_reader & gr, std::vector<struct gguf_k
     return true;
 }
 
-struct gguf_context * gguf_init_from_file_impl(std::istream & is, struct gguf_init_params params) {
-    struct gguf_reader gr(is);
+struct gguf_context * gguf_init_from_file_impl(FILE * file, struct gguf_init_params params) {
+    struct gguf_reader gr(file);
     struct gguf_context * ctx = new gguf_context;
 
     bool ok = true;
@@ -430,18 +425,18 @@ struct gguf_context * gguf_init_from_file_impl(std::istream & is, struct gguf_in
             }
 
             switch (type) {
-                case GGUF_TYPE_UINT8:    ok = ok && gguf_read_emplace_helper<uint8_t>    (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_INT8:     ok = ok && gguf_read_emplace_helper<int8_t>     (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_UINT16:   ok = ok && gguf_read_emplace_helper<uint16_t>   (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_INT16:    ok = ok && gguf_read_emplace_helper<int16_t>    (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_UINT32:   ok = ok && gguf_read_emplace_helper<uint32_t>   (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_INT32:    ok = ok && gguf_read_emplace_helper<int32_t>    (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_FLOAT32:  ok = ok && gguf_read_emplace_helper<float>      (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_BOOL:     ok = ok && gguf_read_emplace_helper<bool>       (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_STRING:   ok = ok && gguf_read_emplace_helper<std::string>(gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_UINT64:   ok = ok && gguf_read_emplace_helper<uint64_t>   (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_INT64:    ok = ok && gguf_read_emplace_helper<int64_t>    (gr, ctx->kv, key, is_array, n); break;
-                case GGUF_TYPE_FLOAT64:  ok = ok && gguf_read_emplace_helper<double>     (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_UINT8:   ok = ok && gguf_read_emplace_helper<uint8_t>    (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_INT8:    ok = ok && gguf_read_emplace_helper<int8_t>     (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_UINT16:  ok = ok && gguf_read_emplace_helper<uint16_t>   (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_INT16:   ok = ok && gguf_read_emplace_helper<int16_t>    (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_UINT32:  ok = ok && gguf_read_emplace_helper<uint32_t>   (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_INT32:   ok = ok && gguf_read_emplace_helper<int32_t>    (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_FLOAT32: ok = ok && gguf_read_emplace_helper<float>      (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_BOOL:    ok = ok && gguf_read_emplace_helper<bool>       (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_STRING:  ok = ok && gguf_read_emplace_helper<std::string>(gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_UINT64:  ok = ok && gguf_read_emplace_helper<uint64_t>   (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_INT64:   ok = ok && gguf_read_emplace_helper<int64_t>    (gr, ctx->kv, key, is_array, n); break;
+                case GGUF_TYPE_FLOAT64: ok = ok && gguf_read_emplace_helper<double>     (gr, ctx->kv, key, is_array, n); break;
                 case GGUF_TYPE_ARRAY:
                 default:
                     {
@@ -593,15 +588,14 @@ struct gguf_context * gguf_init_from_file_impl(std::istream & is, struct gguf_in
     GGML_ASSERT(ctx->info.size() == n_tensors);
 
     // we require the data section to be aligned, so take into account any padding
-    gr.is.seekg(GGML_PAD(size_t(gr.is.tellg()), ctx->alignment), std::ifstream::beg);
-    if (gr.is.bad()) {
+    if (fseek(file, GGML_PAD(ftell(file), ctx->alignment), SEEK_SET) != 0) {
         fprintf(stderr, "%s: failed to seek to beginning of data section\n", __func__);
         gguf_free(ctx);
         return nullptr;
     }
 
     // store the current file offset - this is where the data section starts
-    ctx->offset = gr.is.tellg();
+    ctx->offset = ftell(file);
 
     // compute the total size of the data section, taking into account the alignment
     {
@@ -703,8 +697,16 @@ struct gguf_context * gguf_init_from_file_impl(std::istream & is, struct gguf_in
 }
 
 struct gguf_context * gguf_init_from_file(const char * fname, struct gguf_init_params params) {
-    std::ifstream ifs(fname, std::ios::binary);
-    return gguf_init_from_file_impl(ifs, params);
+    FILE * file = ggml_fopen(fname, "rb");
+
+    if (!file) {
+        fprintf(stderr, "%s: failed to open GGUF file '%s'\n", __func__, fname);
+        return nullptr;
+    }
+
+    struct gguf_context * result = gguf_init_from_file_impl(file, params);
+    fclose(file);
+    return result;
 }
 
 void gguf_free(struct gguf_context * ctx) {
@@ -1132,17 +1134,19 @@ void gguf_set_tensor_data(struct gguf_context * ctx, const char * name, const vo
 }
 
 struct gguf_writer {
-    std::ostream & os;
+    std::vector<int8_t> & buf;
 
-    gguf_writer(std::ostream & os) : os(os) {}
+    gguf_writer(std::vector<int8_t> & buf) : buf(buf) {}
 
     template <typename T>
     void write(const T & val) {
-        os.write(reinterpret_cast<const char *>(&val), sizeof(val));
+        for (size_t i = 0; i < sizeof(val); ++i) {
+            buf.push_back(reinterpret_cast<const int8_t *>(&val)[i]);
+        }
     }
 
     void write(const std::vector<int8_t> & val) {
-        os.write(reinterpret_cast<const char *>(val.data()), val.size());
+        buf.insert(buf.end(), val.begin(), val.end());
     }
 
     void write(const bool & val) {
@@ -1155,7 +1159,9 @@ struct gguf_writer {
             const uint64_t n = val.length();
             write(n);
         }
-        os.write(val.data(), val.size());
+        for (size_t i = 0; i < val.length(); ++i) {
+            buf.push_back(reinterpret_cast<const int8_t *>(val.data())[i]);
+        }
     }
 
     void write(const char * val) {
@@ -1225,33 +1231,33 @@ struct gguf_writer {
     }
 
     void pad(const size_t alignment) {
-        while (size_t(os.tellp()) % alignment != 0) {
+        while (buf.size() % alignment != 0) {
             const int8_t zero = 0;
             write(zero);
         }
     }
 
     void write_tensor_data(const struct gguf_tensor_info & info, const size_t offset_data, const size_t alignment) {
-        GGML_ASSERT(size_t(os.tellp()) - offset_data == info.offset);
+        GGML_ASSERT(buf.size() - offset_data == info.offset);
 
         GGML_ASSERT(ggml_is_contiguous(&info.t));
+        const size_t offset = buf.size();
         const size_t nbytes = ggml_nbytes(&info.t);
 
-        std::vector<int8_t> tmp(nbytes);
+        buf.resize(offset + nbytes);
         if (info.t.buffer) {
-            ggml_backend_tensor_get(&info.t, tmp.data(), 0, nbytes);
+            ggml_backend_tensor_get(&info.t, buf.data() + offset, 0, nbytes);
         } else {
             GGML_ASSERT(info.t.data);
-            memcpy(tmp.data(), info.t.data, nbytes);
+            memcpy(buf.data() + offset, info.t.data, nbytes);
         }
-        write(tmp);
 
         pad(alignment);
     }
 };
 
-void gguf_write_to_buf(const struct gguf_context * ctx, std::ostream & os, bool only_meta) {
-    struct gguf_writer gw(os);
+void gguf_write_to_buf(const struct gguf_context * ctx, std::vector<int8_t> & buf, bool only_meta) {
+    struct gguf_writer gw(buf);
 
     const uint64_t n_kv      = ctx->kv.size();
     const uint64_t n_tensors = ctx->info.size();
@@ -1282,7 +1288,7 @@ void gguf_write_to_buf(const struct gguf_context * ctx, std::ostream & os, bool
         return;
     }
 
-    const size_t offset_data = gw.os.tellp();
+    const size_t offset_data = gw.buf.size();
 
     // write tensor data
     for (uint64_t i = 0; i < n_tensors; ++i) {
@@ -1291,28 +1297,29 @@ void gguf_write_to_buf(const struct gguf_context * ctx, std::ostream & os, bool
 }
 
 bool gguf_write_to_file(const struct gguf_context * ctx, const char * fname, bool only_meta) {
-    std::ofstream fout(fname, std::ios::binary);
+    FILE * file = ggml_fopen(fname, "wb");
 
-    if (!fout) {
-        fprintf(stderr, "%s: failed to open '%s' for writing GGUF data\n", __func__, fname);
+    if (!file) {
+        fprintf(stderr, "%s: failed to open file '%s' for writing GGUF data\n", __func__, fname);
         return false;
     }
 
-    gguf_write_to_buf(ctx, fout, only_meta);
-    return fout.good();
+    std::vector<int8_t> buf;
+    gguf_write_to_buf(ctx, buf, only_meta);
+    const bool ok = fwrite(buf.data(), 1, buf.size(), file) == buf.size();
+    fclose(file);
+    return ok;
 }
 
 size_t gguf_get_meta_size(const struct gguf_context * ctx) {
     // only return size
-    std::stringstream ss;
-    gguf_write_to_buf(ctx, ss, /*only_meta =*/ true);
-    GGML_ASSERT(ss.good());
-    return ss.tellp();
+    std::vector<int8_t> buf;
+    gguf_write_to_buf(ctx, buf, /*only_meta =*/ true);
+    return buf.size();
 }
 
 void gguf_get_meta_data(const struct gguf_context * ctx, void * data) {
-    std::stringstream ss;
-    gguf_write_to_buf(ctx, ss, /*only_meta =*/ true);
-    GGML_ASSERT(ss.good());
-    memcpy(data, ss.rdbuf()->str().data(), ss.tellp());
+    std::vector<int8_t> buf;
+    gguf_write_to_buf(ctx, buf, /*only_meta =*/ true);
+    memcpy(data, buf.data(), buf.size());
 }
diff --git a/tests/test-gguf.cpp b/tests/test-gguf.cpp