Imprime los elementos del vector for (const auto& element : float_vector) { std::cout << element << " "; } return 0; } ``` Asegúrate de incluir y vincular correctamente la biblioteca 'Boost' en tu proyecto. Este es solo un ejemplo básico y podrías necesitar hacer ajustes adicionales según tu entorno y requerimientos específicos.

25 Jul, 2023 Programación 0

En mi proyecto trabajo con vectores de palabras como matrices de numpy con una dimensión de 300. Quiero almacenar las matrices procesadas en una base de datos de mongo, codificadas en base64, porque esto ahorra mucho espacio de almacenamiento.

Código en Python

import base64
import numpy as np

vector = np.zeros(300, dtype=np.float32) # representa algún vector de palabras
vector = base64.b64encode(vector) # codificación en base64
# Guardando el vector en MongoDB...

En MongoDB se guarda como binario como se muestra en este enlace. En C++, me gustaría cargar estos datos binarios como un std::vector. Por lo tanto, primero tengo que decodificar los datos y luego cargarlos correctamente. Pude obtener los datos binarios en el programa de c++ con mongocxx y los tengo como un uint8_t* con un tamaño de 1600, pero ahora no sé qué hacer y estaría feliz si alguien pudiera ayudarme. Gracias (:

Código en C++

const bsoncxx::document::element elem_vectors = doc["vectors"];
const bsoncxx::types::b_binary vectors = elemVectors.get_binary();

const uint32_t b_size = vectors.size; // == 1600
const uint8_t* first = vectors.bytes;

// ¿Cómo analizar esto como un std::vector<float> con un tamaño de 300?

Solución

Añadí estas líneas a mi código de C++ y pude cargar un vector con 300 elementos y todos los valores correctos.

c++ const std::string encoded(reinterpret_cast<const char*="">(first), b_size); std::string decoded = decodeBase64(encoded); std::vector<float> vec(300); for (size_t i = 0; i < decoded.size() / sizeof(float); ++i) { vec[i] = *(reinterpret_cast<const float*="">(decoded.c_str() + i * sizeof(float))); }

Mencionar: Gracias a la información de @Holt, no es sabio codificar una matriz de Numpy en base64 y luego almacenarla como binario. Es mucho mejor llamar “.tobytes()” en la matriz de numpy y luego almacenar eso en MongoDB, porque reduce el tamaño del documento de 1.7kb (base64) a 1.2kb (tobytes()) y luego ahorra tiempo de computación porque ¡no es necesario calcular la codificación (¡y decodificación!)!

davy.ai

July 25, 2023 at 7:30 am

Para cargar los datos binarios como un std::vector<float> en C++, primero necesitas decodificar los datos base64. Esto se puede hacer utilizando una función de decodificación base64, como decodeBase64().

Una vez que tienes los datos decodificados como un std::string, puedes crear un std::vector con un tamaño de 300 e iterar sobre el string decodificado para llenar cada elemento del vector.

Aquí tienes un ejemplo de código en C++ que ilustra esto:

“`c++
#include
#include
#include

std::string decodeBase64(const std::string& encoded); // función de decodificación base64

// …

const bsoncxx::document::element elem_vectors = doc[“vectors”];
const bsoncxx::types::b_binary vectors = elem_vectors.get_binary();
const uint32_t b_size = vectors.size;
const uint8_t* first = vectors.bytes;

// decodificar los datos base64
const std::string encoded(reinterpret_cast(first), b_size);
std::string decoded = decodeBase64(encoded);

// crear un std::vector con un tamaño de 300 y llenar cada elemento
std::vector vec(300);
for (size_t i = 0; i < decoded.size() / sizeof(float); ++i) {
vec[i] = *(reinterpret_cast(decoded.c_str() + i * sizeof(float)));
}
“`

Vale la pena señalar que codificar una matriz de numpy como base64 y luego almacenarla como binario puede que no sea el enfoque más eficiente. En su lugar, podrías llamar a .to_bytes() en la matriz de numpy y almacenar los bytes resultantes en MongoDB. Esto reduciría el tamaño del documento y ahorraría tiempo de computación, ya que no habría necesidad de codificar y decodificar los datos.

Answer

davy.ai

July 25, 2023 at 7:30 am

Para cargar los datos binarios como un std::vector<float> en C++, primero necesitas decodificar los datos base64. Esto se puede hacer utilizando una función de decodificación base64, como decodeBase64().

Una vez que tienes los datos decodificados como un std::string, puedes crear un std::vector con un tamaño de 300 e iterar sobre el string decodificado para llenar cada elemento del vector.

Aquí tienes un ejemplo de código en C++ que ilustra esto:

“`c++
#include
#include
#include

std::string decodeBase64(const std::string& encoded); // función de decodificación base64

// …

const bsoncxx::document::element elem_vectors = doc[“vectors”];
const bsoncxx::types::b_binary vectors = elem_vectors.get_binary();
const uint32_t b_size = vectors.size;
const uint8_t* first = vectors.bytes;

// decodificar los datos base64
const std::string encoded(reinterpret_cast(first), b_size);
std::string decoded = decodeBase64(encoded);

// crear un std::vector con un tamaño de 300 y llenar cada elemento
std::vector vec(300);
for (size_t i = 0; i < decoded.size() / sizeof(float); ++i) {
vec[i] = *(reinterpret_cast(decoded.c_str() + i * sizeof(float)));
}
“`

Vale la pena señalar que codificar una matriz de numpy como base64 y luego almacenarla como binario puede que no sea el enfoque más eficiente. En su lugar, podrías llamar a .to_bytes() en la matriz de numpy y almacenar los bytes resultantes en MongoDB. Esto reduciría el tamaño del documento y ahorraría tiempo de computación, ya que no habría necesidad de codificar y decodificar los datos.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Answer

davy.ai