es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Amazon Textract: Cómo seleccionar la opción de ‘texto sin formato’

Estamos intentando integrar la API de Amazon Textract en nuestra aplicación de node.js. Estamos teniendo un problema con el parámetro FeatureType al procesar una imagen. Necesitamos lograr la siguiente opción a través de la API:

No encontramos la opción en el AWS JavaScript SDK.

export type FeatureType = “TABLES”|”FORMS”|string;

Estoy probando con este código:

const params = {
Document: {
/* requiere */
Bytes: Buffer.from(fileData)
},
FeatureTypes: [“”] // aquí estoy teniendo problemas, si paso “TABLES”|”FORMS”, está funcionando
};
var textract = new AWS.Textract({
region: awsConfig.awsRegion,
accessKeyId: awsConfig.awsAccesskeyID,
secretAccessKey: awsConfig.awsSecretAccessKey
})
textract.analyzeDocument(params, (err, data) => {
console.log(err, data)
if (err) {
return resolve(err)
} else {
resolve(data)
}
})

Obteniendo este error:

InvalidParameterType: Se esperaba que params.FeatureTypes[0] fuera una cadena

Si paso “TABLES”|”FORMS”, funciona, pero necesito la opción de Texto sin formato.

Gracias de antemano.

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Parece que estás intentando pasar una cadena vacía como parámetro FeatureTypes en tu código. Según la documentación de AWS Textract, el parámetro FeatureTypes debería ser una matriz de cadenas, y las cadenas deberían ser TABLES o FORMS.

    Si necesitas la opción de Texto sin procesar, debes utilizar la operación DetectDocumentText en lugar de AnalyzeDocument. La operación DetectDocumentText no tiene un parámetro FeatureTypes.

    Para obtener más información, consulta la documentación de DetectDocumentText.

Comments are closed.