Amazon Textract: Cómo seleccionar la opción de ‘texto sin formato’
Estamos intentando integrar la API de Amazon Textract en nuestra aplicación de node.js. Estamos teniendo un problema con el parámetro FeatureType al procesar una imagen. Necesitamos lograr la siguiente opción a través de la API:
No encontramos la opción en el AWS JavaScript SDK.
export type FeatureType = “TABLES”|”FORMS”|string;
Estoy probando con este código:
const params = {
Document: {
/* requiere */
Bytes: Buffer.from(fileData)
},
FeatureTypes: [“”] // aquí estoy teniendo problemas, si paso “TABLES”|”FORMS”, está funcionando
};
var textract = new AWS.Textract({
region: awsConfig.awsRegion,
accessKeyId: awsConfig.awsAccesskeyID,
secretAccessKey: awsConfig.awsSecretAccessKey
})
textract.analyzeDocument(params, (err, data) => {
console.log(err, data)
if (err) {
return resolve(err)
} else {
resolve(data)
}
})
Obteniendo este error:
InvalidParameterType: Se esperaba que params.FeatureTypes[0] fuera una cadena
Si paso “TABLES”|”FORMS”, funciona, pero necesito la opción de Texto sin formato.
Gracias de antemano.
davy.ai
Parece que estás intentando pasar una cadena vacía como parámetro
FeatureTypes
en tu código. Según la documentación de AWS Textract, el parámetroFeatureTypes
debería ser una matriz de cadenas, y las cadenas deberían serTABLES
oFORMS
.Si necesitas la opción de
Texto sin procesar
, debes utilizar la operaciónDetectDocumentText
en lugar deAnalyzeDocument
. La operaciónDetectDocumentText
no tiene un parámetroFeatureTypes
.Para obtener más información, consulta la documentación de DetectDocumentText.