Pruebe Amazon CloudSearch de forma gratuita
Comenzar prueba gratuita de CloudSearchMás información
Disfrute de 750 horas gratis de instancias de búsqueda plenamente funcionales durante 30 días. Para comenzar:
Inicie sesión en su cuenta de AWS y lance la consola de CloudSearch
Cree un dominio de búsqueda y configúrelo con unos pocos clics del mouse
Cargue datos y envíe solicitudes de búsqueda o actualización a través de la consola, el AWS SDK o la CLI
P: ¿Qué es Amazon CloudSearch?
Amazon CloudSearch es un servicio en la nube de AWS completamente administrado que facilita la configuración, la administración y el escalado de una solución de búsqueda para su sitio web o aplicación.
P: ¿Qué beneficios aporta ejecutar un servicio de búsqueda administrado como Amazon CloudSearch en comparación con ejecutar mi propio servicio de búsqueda en EC2?
Amazon CloudSearch ofrece varios beneficios con respecto a la ejecución de su propio servicio de búsqueda completamente administrado, como una configuración sencilla, escalado automático de datos y tráfico, clústeres de recuperación automática y alta disponibilidad con zonas de disponibilidad múltiples (Multi-AZ). Con unos pocos clics en la consola de administración de AWS, puede crear fácilmente un dominio de búsqueda y cargar los datos que desea que se puedan buscar. Amazon CloudSearch se encarga de aprovisionar automáticamente los recursos necesarios e implementa un índice de búsqueda muy ajustado.
P: ¿Qué es un motor de búsqueda?
Un motor de búsqueda permite buscar en grandes colecciones de elementos de datos principalmente textuales (denominados "documentos") para encontrar rápidamente las mejores coincidencias. Las peticiones de búsqueda suelen ser unas pocas palabras de texto no estructurado como "películas matt damon". Los resultados suelen clasificarse: primero aparecen los que tienen mayor coincidencia o relevancia (los que tienen más relación con las palabras de búsqueda).
Los documentos pueden carecer totalmente de estructura o pueden contener varios campos que se pueden buscar opcionalmente de forma individual. Por ejemplo, un servicio de búsqueda de películas puede tener documentos con campos para título, director, actor, descripción y críticas. Los resultados devueltos por un motor de búsqueda suelen ser proxies de los documentos subyacentes, como URL que hacen referencia a páginas web concretas. Sin embargo, el servicio de búsqueda también puede devolver contenido que aparezca realmente en campos individuales.
P: ¿Qué beneficios ofrece Amazon CloudSearch?
Amazon CloudSearch es un servicio de búsqueda completamente administrado que se escala de forma automática con el volumen de datos y la complejidad de las peticiones de búsqueda para conseguir resultados rápidos y precisos. Amazon CloudSearch permite que los clientes añadan la capacidad de búsqueda sin necesidad de administrar hosts, tráfico y escalado de datos, redundancia o paquetes de software. Los usuarios pagan tarifas por hora reducidas solo por los recursos consumidos. Amazon CloudSearch puede ofrecer un costo total de propiedad significativamente más bajo, en comparación con el funcionamiento y la administración de su propio entorno de búsqueda.
P: ¿Se puede utilizar Amazon CloudSearch con un servicio de almacenamiento?
Los servicios de búsqueda y almacenamiento son complementarios. Un servicio de búsqueda exige que los documentos ya estén almacenados en algún lugar, ya sean archivos o en un sistema de archivos, datos en Amazon S3 o registros en una instancia de Amazon DynamoDB o Amazon RDS. El servicio de búsqueda es un sistema de recuperación rápido que hace que se puedan buscar estos elementos con latencias subsecundarias a través de un proceso denominado "indexación".
P: ¿Puede utilizarse Amazon CloudSearch con una base de datos?
Los motores de búsqueda y las bases de datos no se excluyen entre sí, de hecho, a veces se utilizan de forma conjunta. Si ya tiene una base de datos con datos estructurados, puede que quiera usar un motor de búsqueda para filtrar de forma inteligente y clasificar el contenido de la base de datos utilizando palabras clave como criterio de relevancia.
Se puede usar un servicio de búsqueda para indexar y buscar datos tanto estructurados como no estructurados. El contenido puede proceder de varios orígenes e incluir campos de bases de datos junto con archivos en varios formatos, páginas web, etc. Un servicio de búsqueda puede soportar una clasificación de resultados personalizable, así como características de búsqueda especiales como el uso de facetas de filtrado no disponibles en las bases de datos.
P: ¿En qué regiones está disponible Amazon CloudSearch?
Amazon CloudSearch está disponible en las siguientes regiones de AWS: EE.UU. Este (Norte de Virginia), EE.UU. Oeste (Oregón), EE.UU. Oeste (Norte de California), UE (Irlanda), UE (Fráncfort), América del Sur (São Paulo) y Asia Pacífico (Singapur, Tokio, Sídney y Seúl).
P: ¿Qué nuevas características soporta Amazon CloudSearch?
En la última versión, Amazon CloudSearch soporta varias características de búsqueda y administración nuevas. Las nuevas características clave son:
- Soporte para idiomas:
- 34 idiomas, además de “varias opciones” para administrar campos de idiomas combinados
- Configuración de idioma por campo
- Análisis de texto en función del idioma
- Hay varios niveles de derivación algorítmica disponibles para muchos idiomas, incluido el nivel “ninguno”
- Características de búsqueda mejoradas:
- Sugerencias
- Resaltado
- Búsqueda geoespacial
- Nuevos tipos de datos: fecha, doble, entero firmado de 64 bits, LatLon
- Búsqueda de frase descuidada
- Acelerador de términos
- Búsqueda por intervalos mejorada para todos los tipos de campos
- Soporte para varios analizadores de consultas: sencillo, estructurado, lucene, dismax
- Opciones de configuración del analizador de consultas
- Características de administración:
- Opción de alta disponibilidad
- Integración de IAM
- Escalado configurable por el usuario
- Opción de alta disponibilidad
- Disponible en regiones de AWS adicionales: Asia Pacífico (Tokio), Asia Pacífico (Singapur), Asia Pacífico (Sídney), Asia Pacífico (Seúl) y América del Sur (São Paulo).
P: ¿Amazon CloudSearch todavía soporta la lematización del diccionario?
Sí. La nueva versión de Amazon CloudSearch soporta la derivación del diccionario, además de la derivación algorítmica.
P: ¿La nueva versión de Amazon CloudSearch utiliza Apache Solr?
Sí. La última versión de Amazon CloudSearch se ha modificado para utilizar Apache Solr como el motor de búsqueda de texto subyacente. Amazon CloudSearch ahora ofrece varias características de motores de búsqueda populares disponibles con Apache Solr, además de la experiencia del servicio de búsqueda administrado que facilita la configuración, la operación y el escalado de un dominio de búsqueda.
P: ¿Puedo obtener acceso a la nueva versión de Amazon CloudSearch a través de la consola?
Sí. Puede obtener acceso a la nueva versión de Amazon CloudSearch a través de la consola. Si es un cliente actual de Amazon CloudSearch con dominios de búsqueda existentes, puede seleccionar qué versión de Amazon CloudSearch utilizar para crear nuevos dominios de búsqueda. Los nuevos clientes utilizarán la nueva versión de Amazon CloudSearch de forma predeterminada y no tendrán acceso a la versión 2011-01-01.
P: ¿Qué tipos de datos soporta la nueva versión de Amazon CloudSearch?
Amazon CloudSearch soporta dos tipos de campos de texto (texto y literal). Los campos de texto se procesan según el idioma configurado para el campo, a fin de determinar las palabras individuales que pueden servir como coincidencias para las consultas. Los campos literales no se procesan y la coincidencia debe ser exacta, incluida las mayúsculas y minúsculas. CloudSearch también soporta cuatro tipos numéricos: entero, doble, fecha y LatLon. Los campos de enteros contienen valores de enteros firmados de 64 bits. Los campos dobles contienen valores de punto flotante de doble ancho. Los campos de fecha contienen fechas especificadas en UTC (Tiempo Universal Coordinado), según la norma RFC3339 de la IETF: dd-mm-aaaaT00:00:00Z. Los campos de coordenadas contienen una ubicación almacenada como un par de valores de latitud y longitud.
P: ¿Los dominios de búsqueda existentes creados con la versión 2011-02-01 de Amazon CloudSearch continuarán funcionando?
Sí. Los dominios de búsqueda existentes creados con la versión 2011-02-01 de Amazon CloudSearch continuarán funcionando.
P: ¿Podré utilizar las nuevas características en los dominios de búsqueda existentes creados con la versión 2011-01-01 de Amazon CloudSearch?
No. Los dominios de búsqueda existentes creados con la versión 2011-01-01 de Amazon CloudSearch no tendrán acceso a las características disponibles en la nueva versión. Para obtener acceso a las nuevas características, tendrá que crear un nuevo dominio de búsqueda con la versión 2013-01-01 de Amazon CloudSearch.
P: ¿Cómo puedo migrar las aplicaciones compiladas con la versión 2011-01-01 de Amazon CloudSearch a la nueva versión de Amazon CloudSearch?
Para utilizar la nueva versión de Amazon CloudSearch, necesita volver a crear los dominios existentes con la nueva versión de Amazon CloudSearch y volver a cargar los datos. Para obtener más información, consulte Migrating to the 2013-01-01 API en la guía para desarrolladores Amazon CloudSearch Developer Guide.
P: ¿AWS continuará soportando la versión 2011-02-01 de Amazon CloudSearch?
Sí. AWS continuará soportando la versión 2011-02-01 de Amazon CloudSearch.
P: ¿Puedo crear nuevos dominios de búsqueda con la versión 2011-02-01 de Amazon CloudSearch?
Los clientes actuales de Amazon CloudSearch que tengan dominios existentes 2011-02-01 podrán elegir si los nuevos dominios utilizan el API 2011-02-01 o la nueva API 2013-01-01. Los dominios de búsqueda creados por nuevos clientes se crearán automáticamente con la API 2013-01-01.
P: ¿Puedo beneficiarme de la oferta de prueba gratuita de la nueva versión de Amazon CloudSearch?
Los nuevos clientes podrán probar la versión de prueba gratuita disponible con Amazon CloudSearch. Consulte Amazon CloudSearch: programa de versiones de prueba gratuito de 30 días para obtener más detalles.
P: ¿Cómo puedo comenzar a utilizar Amazon CloudSearch?
Para inscribirse en Amazon CloudSearch, haga clic en el botón Registrarse ahora de la página de detalles de Amazon CloudSearch y complete el proceso de inscripción. Debe tener una cuenta de Amazon Web Services. Si aún no la tiene, se le pedirá que cree una al comenzar el proceso de inscripción de Amazon CloudSearch.
Una vez que se haya inscrito, seleccione Amazon CloudSearch en la consola de administración de AWS. A través de la consola de Amazon CloudSearch podrá crear rápidamente un dominio de búsqueda, configurar los campos de búsqueda, cargar datos de muestra y enviar consultas de búsqueda a su dominio de búsqueda. También puede utilizar los SDK y la CLI de AWS para realizar estas operaciones.
Para obtener más información, consulte el tutorial Getting Started en la guía para desarrolladores Amazon CloudSearch Developer Guide.
P: ¿Ofrecen los AWS SDK soporte para Amazon CloudSearch?
Sí, los AWS SDK para Java, Ruby, Python, .Net, PHP y Node.js soportan CloudSearch. Mediante los AWS SDK puede crear rápidamente un dominio de búsqueda, configurar los campos de búsqueda, cargar datos y enviar consultas de búsqueda a su dominio de búsqueda.
P: ¿Ofrece la CLI de AWS soporte para Amazon CloudSearch?
Sí, la CLI de AWS soporta CloudSearch. Mediante la CLI de AWS puede crear rápidamente un dominio de búsqueda, configurar los campos de búsqueda, cargar datos y enviar consultas de búsqueda a su dominio de búsqueda.
P: ¿Puedo seguir utilizando las CLT de Amazon CloudSearch?
Sí, las CLT de Amazon CloudSearch seguirán funcionando.
P: ¿Qué es un dominio de búsqueda y cómo puedo crear uno?
Un dominio de búsqueda es un contenedor de datos y un conjunto de servicios que hace que se puedan buscar los datos. Estos servicios incluyen:
- Un servicio de documentos que permite cargar datos en su dominio para indexación.
- Un servicio de búsqueda que permite realizar peticiones de búsqueda entre los datos indexados.
- Un servicio de configuración para controlar el comportamiento del dominio (incluida la clasificación de relevancia).
Puede crear, administrar y eliminar dominios de búsqueda mediante la consola de administración de AWS, los AWS SDK o la CLI de AWS.
P: ¿Cómo puedo cargar documentos en mi dominio de búsqueda?
Puede cargar documentos en su dominio con la consola de administración de AWS, los AWS SDK o la interfaz de línea de comandos (CLI) de AWS.
P: ¿Necesito que mis documentos tengan un formato en concreto?
Para que los datos se puedan buscar, debe darles el formato JSON o XML. Cada elemento que desee que se pueda recibir como resultado de una búsqueda está representado como un documento. Cada documento tiene un ID de documento exclusivo y uno o varios campos que contienen los datos que desea buscar y obtener en los resultados. Amazon CloudSearch genera un índice de búsqueda a partir de los datos del documento según los campos de índice configurados para el dominio. A medida que sus datos cambien, deberá enviar actualizaciones para añadir o eliminar documentos del índice.
P: ¿Cómo puedo crear lotes de documentos con formato para Amazon CloudSearch?
Para crear lotes de documentos en los que se describan los datos, debe crear archivos de texto JSON o XML en los que se especifique:
- Tipo de operación: añadir o eliminar
- Identificador único
- Campos reales y sus datos
El siguiente ejemplo muestra un único lote de documentos con formato JSON:
[
{
"fields" : {
"directors" : [
"Francis Lawrence"
],
"release_date" : "2013-11-11T00:00:00Z",
"genres" : [
"Action",
"Adventure",
"Sci-Fi",
"Thriller"
],
"image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
"plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
"title" : "The Hunger Games: Catching Fire",
"rank" : 4,
"running_time_secs" : 8760,
"actors" : [
"Jennifer Lawrence",
"Josh Hutcherson",
"Liam Hemsworth"
],
"year" : 2013
},
"id" : "tt1951264",
"type" : "add"
}
]
Tenga en cuenta que los valores numéricos, como el año, no se indican entre comillas y que los valores de campos multivalor, como los géneros, se enumeran en una matriz JSON.
Para que estos datos estén disponibles en Amazon CloudSearch, puede guardarlos en un archivo y cargarlos con la consola de administración de AWS, los AWS SDK o la CLI de AWS.
P: ¿Cómo se indexan los documentos?
Los documentos se indexan automáticamente cuando los carga en el dominio de búsqueda. Puede volver a indexar explícitamente sus documentos cuando realice cambios de configuración mediante el envío de una petición IndexDocuments.
P: ¿Por qué necesito volver a indexar mi dominio?
Algunas opciones de configuración, como la adición de un nuevo campo del índice o la actualización de derivaciones o diccionarios de palabras excluidas, no están disponibles hasta que no se vuelve a indexar el dominio. Cuando ha realizado cambios que necesitan indexación, el estado del dominio indicará que se debe indexar. Puede iniciar la indexación desde la consola de administración de AWS, los AWS SDK o la interfaz de línea de comandos (CLI) de AWS.
P: ¿Cómo envío peticiones de búsqueda a mi dominio de búsqueda?
Cada dominio de búsqueda tiene un servicio de búsqueda basado en REST con una URL única (punto de enlace de búsqueda) que acepta peticiones de búsqueda para su conjunto de documentos. Puede enviar solicitudes de búsqueda desde la consola de administración de AWS, los AWS SDK o la interfaz de línea de comandos (CLI) de AWS.
P: ¿Puede un dominio de búsqueda abarcar zonas de disponibilidad múltiples?
Sí. Si habilita la opción Multi-AZ, Amazon CloudSearch implementa otras instancias en una segunda zona de disponibilidad de la misma región. Para obtener más información, consulte la sección Configuring Availability Options en la guía para desarrolladores Amazon CloudSearch Developer Guide.
P: ¿Puedo mover un dominio de búsqueda de una región a otra?
En estos momentos no se puede migrar automáticamente un dominio de búsqueda de una región a otra. Debe crear un nuevo dominio en la región de destino, configurarlo y cargar sus datos para, a continuación, eliminar el dominio original.
P: ¿Cómo elimino mi dominio de búsqueda?
Para eliminar un dominio de búsqueda, haga clic en el botón Delete Domain en la consola de Amazon CloudSearch. También puede eliminar dominios mediante los AWS SDK o la CLI de AWS.
P: ¿Cómo elimino documentos de mi dominio de búsqueda?
Para eliminar documentos, debe especificar una operación de eliminación en la carga del lote que contenga el ID del documento que desea quitar.
Puede enviar actualizaciones de datos mediante la consola de administración de AWS, los AWS SDK o la interfaz de línea de comandos (CLI) de AWS.
P: ¿Cómo vacío mi dominio de búsqueda?
Si desea conservar los puntos de enlace de su dominio, puede enviar una orden de eliminación para cada documento del mismo.
P: ¿Por qué mi dominio se encuentra en estado “en procesamiento”?
Los dominios pueden encontrarse en tres estados diferentes: “en procesamiento”, “activo” o “en reindexación”. Normalmente, el dominio se encuentra en estado “activo”, es decir, no se está realizando ningún cambio, se pueden efectuar consultas y actualizaciones en el dominio, y los cambios anteriores aparecen en los resultados de búsqueda.
Cuando es necesario reindexar un dominio, Amazon CloudSearch debe reconstruir el índice por completo. Sin embargo, el dominio no adopta el estado "en procesamiento" hasta que no se inicia la reindexación. En esta fase, se pueden realizar consultas y actualizaciones al dominio, pero los cambios en la configuración no aparecerán en los resultados de búsqueda hasta que se complete la indexación y el dominio vuelva a estar “activo”.
Asimismo, puede seguir cargando lotes de documentos al dominio. Sin embargo, si realiza una gran cantidad de actualizaciones mientras el dominio se encuentra en estado "en procesamiento", se puede tardar más en aplicar dichas actualizaciones al índice de búsqueda. Si esto se convierte en un problema, efectúe menos actualizaciones hasta que el dominio vuelva a encontrarse en estado "activo".
P: ¿Cuáles son las prácticas recomendadas para el proceso de arranque de datos en CloudSearch?
Una vez lanzado su dominio, ha de cargar los datos en Amazon CloudSearch. Es probable que tenga que cargar un solo conjunto de datos de gran tamaño y, posteriormente, realizar pequeñas actualizaciones o agregar elementos a medida que obtenga nuevos datos. Las siguientes directrices le ayudarán a efectuar el proceso de arranque de los datos inicial en CloudSearch de manera rápida y sencilla.
1. Utilice la herramienta de línea de comandos curl-v cuando prepare el script
Al cargar el conjunto de datos, el script que ha escrito lee los datos y los usa para crear documentos JSON o XML. Aconsejamos preparar el script con antelación, a través de curl o cualquier otra herramienta de línea de comandos, para comprobar si puede cargar los documentos que crea el script. La opción “-v” de curl proporciona más información detallada sobre problemas de sintaxis que el AWS SDK o Boto, los cuales reducen los errores para favorecer la producción. Curl muestra mensajes de error más detallados, que ayudan a identificar la causa de los problemas.
2. Utilice el código de caracteres UTF-8
Asegúrese de que todos los datos poseen el formato de código de caracteres UTF-8 y de que se ha eliminado cualquier carácter dañado de Unicode antes de la carga a CloudSearch. Los caracteres no compatibles harán que falle la carga del documento.
3. Organice los documentos en lotes
La organización de los documentos en lotes quizás sea el paso más importante del proceso de arranque de datos. Enviar los documentos a CloudSearch de manera individual no solo resulta poco eficaz, sino que genera errores fáciles de prevenir.
Un lote de documentos no es más que un conjunto de operaciones de agregación y eliminación que representan los documentos que desea añadir, actualizar o eliminar de su dominio. Los lotes se describen en JSON o XML. Cuando los carga en un domino, los datos se indexan automáticamente, de acuerdo con las opciones de indexación del dominio. Como se cobra por la cantidad total de lotes de documentos cargados en el dominio de búsqueda, resulta más eficaz cargar los datos en lotes de 5 MB, la cantidad máxima permitida por carga. También puede cargar lotes simultáneamente para reducir el tiempo que se tarda en cargar los datos.
4. Escale por adelantado
Es importante escalar los datos por adelantado antes de cargarlos en CloudSearch. Escalar por adelantado consiste en seleccionar el tipo de instancia adecuada para la cantidad de datos que desea cargar.
Si elige una instancia con capacidad suficiente para abastecer el tamaño de la carga, puede evitar errores y recuentos de replicación elevados. Aunque la replicación puede ayudar a reducir el tiempo de respuesta de la búsqueda, no incrementa el tamaño del canal de datos ni soluciona problemas principales de la carga de datos.
CloudSearch escala de manera automática a instancias de mayor tamaño a medida que envía más datos. Aún así, seleccionar el tipo de instancia adecuado por adelantado le ahorra tiempo más adelante en el proceso de arranque, ya que el escalado de una instancia a otra suele ser un proceso lento. A continuación se muestra un script de muestra que le permite escalar por adelantado el dominio para el proceso de arranque y restablecer el tipo de instancia tras la carga de los datos.
Escalar por adelantado antes del proceso de arranque:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge
aws cloudsearch index-documents --domain-name foo
Restablecer tras la carga de los datos:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small
aws cloudsearch index-documents --domain-name foo
P: ¿Cómo se pueden evitar los errores de tipo 504?
Si se encuentra con errores de tipo 504 o recuentos de replicación elevados, intente pasarse a un tipo de instancia de mayor tamaño. Por ejemplo, si tiene problemas con m3.large, pásese a m3.xlarge. Si continúa encontrándose con errores de tipo 504 tras escalar por adelantado, comience a organizar los datos en lotes y espere más tiempo entre los reintentos.
P: ¿Cuáles son las prácticas recomendadas para acelerar la configuración y reindexación del dominio?
Cuando cambia las opciones de configuración del dominio de búsqueda, debe reconstruir el índice de búsqueda para que los cambios se reflejen en los resultados de búsqueda. La reconstrucción del índice puede tardar entre 30 y 60 minutos, independientemente de si realiza un cambio o varios a la vez en la configuración. Aunque el dominio solamente contenga un pequeño número de documentos, la reindexación tarda lo mismo, como consecuencia de las tareas de procesamiento y aprovisionamiento necesarias para construir y distribuir el índice. Por lo tanto, debería planificar los cambios en la configuración por adelantado, realizarlos todos a la vez y, a continuación, reindexar el dominio. Se aconseja seguir el mismo procedimiento cuando se crea un dominio nuevo. Planifique la configuración antes de crearlo, para que pueda indexarlo solo una vez y ponerse en marcha con la mayor brevedad posible.
Algunos cambios en el dominio requieren la reindexación, mientras que otros solo necesitan que se vuelva a implementar el índice existente. Volver a implementar el dominio tarda entre 10 y 15 minutos, en comparación con los 30-60 minutos de la reindexación. Al volver a implementar el índice, CloudSearch crea nuevos nodos, implementa el índice en ellos y elimina los antiguos. El estado del dominio cambia a “en proceso” durante la operación. Cuando es necesario realizar una reindexación, el estado del dominio cambia a "Needs Indexing" y, a continuación, a "Processing" una vez iniciada la indexación. Tras la creación del nuevo índice, se vuelve a implementar el dominio. La siguiente tabla resume los cambios que requieren la reindexación y que se vuelva a implementar el índice, así como los cambios que solo exigen que se vuelva a implementar el índice. Conocer esta información le ayudará a planificar mejor los cambios en la configuración.
Cambio |
Se necesita reindexación |
Se debe volver a implementar el índice |
Multi-AZ | No |
Sí |
Campos de índice |
Sí |
Sí |
Opciones de los campos de índice |
Sí | Sí |
Tipo de instancia |
Sí | Sí |
Recuento de particiones |
Sí | Sí |
Recuento de replicación |
No | Sí |
Sugerencias |
Sí | Sí |
Expresiones |
No | Sí |
Esquemas de análisis |
Sí | Sí |
P: ¿Qué características de búsqueda ofrece Amazon CloudSearch?
Amazon CloudSearch ofrece características para indexar y buscar tanto datos estructurados como texto sin formato, incluida la búsqueda por facetas, la búsqueda de texto libre, las expresiones de búsqueda booleanas, la clasificación por relevancia personalizable, las expresiones de clasificación por tiempo de consulta, el peso de los campos, la búsqueda y la ordenación de los resultados mediante cualquier campo, así como opciones de procesamiento de texto que incluyen la tokenización, las palabras excluidas, la derivación y los sinónimos. También ofrece indexación casi en tiempo real para actualizaciones de documentos. Las nuevas características son:
- Sugerencias de autocompletar
- Resaltado
- Búsqueda geoespacial
- Nuevos tipos de datos: fecha, doble, entero firmado de 64 bits, LatLon
- Campos dinámicos
- Estadísticas de los campos de índice
- Búsqueda de frase descuidada
- Acelerador de términos
- Búsqueda por intervalos mejorada para todos los tipos de campos
- Filtros de búsqueda que no afectan a la relevancia
- Soporte para varios analizadores de consultas: sencillo, estructurado, lucene, dismax
- Opciones de configuración del analizador de consultas
P: ¿Qué es la creación de facetas?
La creación de facetas permite categorizar los resultados de búsqueda en información filtrada en la que el usuario puede seguir buscando. Por ejemplo, puede que un usuario busque "paraguas" y las facetas permitan agrupar los resultados por precio, como 0-10 USD, 10-20 USD, 20-40 USD, etc. Amazon CloudSearch también permite que los recuentos de los resultados se incluyan en facetas, de manera que dicha información filtrada tenga un recuento de los documentos de ese grupo. El ejemplo entonces podría ser: 0-10 USD (4 elementos), 10-20 USD (123 elementos), 20-40 USD (57 elementos) y así sucesivamente.
P: ¿Qué lenguajes soporta Amazon CloudSearch?
Amazon CloudSearch actualmente se encuentra disponible en 34 idiomas: árabe (ar), armenio (hy), euskera (eu), búlgaro (bg), catalán (ca), chino simplificado (zh-Simp), chino tradicional (zh-Trad), checho (cs), danés (da), neerlandés (nl), inglés (en), finlandés (fi), francés (fr), gallego (gl), alemán (de), griego (el), hebreo (he), hindi (hi), húngaro (hu), indonesio (id), irlandés (ga), italiano (it), japonés (ja), coreano (ko), letón (la), noruego (no), persa (fa), portugués (pt), rumano (ro), ruso (ru), español (es), sueco (sv), tailandés (th) y turco (tr). Además, Amazon CloudSearch soporta una opción múltiple para los campos que contienen combinaciones de idiomas.
P: ¿Soporta Amazon CloudSearch la búsqueda geoespacial?
Sí, Amazon CloudSearch tiene un tipo nativo para soportar la latitud y longitud (latlon), a fin de que pueda implementar fácilmente la clasificación y búsqueda basadas en elementos geográficos. Para obtener más información, consulte la sección Searching and Ranking Results by Geographic Location en la guía para desarrolladores Amazon CloudSearch Developer Guide.
P: ¿Con qué rapidez se podrán haber búsquedas de mis documentos cargados?
Normalmente se puede buscar entre los documentos cargados en un dominio de búsqueda en un plazo de segundos a unos pocos minutos tras su carga.
P: ¿Cuántas peticiones de búsqueda puedo enviar a mi dominio de búsqueda?
No hay un límite propiamente dicho sobre el número de peticiones de búsqueda que se pueden enviar a un dominio de búsqueda.
P: ¿Qué factores afectan a la latencia de mis peticiones de búsqueda?
Las peticiones de búsqueda se procesan tradicionalmente en unos pocos cientos de milisegundos, con frecuencia mucho más rápido. La latencia se ve afectada por muchos factores, incluidos el tiempo que tardan la solicitud y las respuestas en ir de su propia aplicación al dominio de búsqueda, la complejidad de la petición de búsqueda y la carga de uso del dominio de búsqueda.
P: ¿Qué hace que una petición de búsqueda sea más compleja que otra?
Amazon CloudSearch está diseñado para procesar eficazmente una amplia gama de peticiones de búsqueda muy rápidamente. Las peticiones de búsqueda tienen una complejidad variable en función de las expresiones que determinan qué documentos coinciden y los criterios adicionales que determinan la exactitud con la que coincide cada documento. Las peticiones de búsqueda que coinciden con un gran número de documentos tardan más en procesarse que las que coinciden con pocos documentos. Las peticiones de búsqueda que calculan expresiones complejas tardan más en procesarse que aquellas que se clasifican con un criterio muy sencillo, como un campo único. Para ayudarle a comprender la diferencia en la complejidad entre las solicitudes de búsqueda, el tiempo que tarda en procesarse la solicitud se devuelve como parte de la respuesta.
P: ¿Dónde debo ejecutar mi aplicación de búsqueda para minimizar el tiempo de comunicación con mi dominio de búsqueda?
Las aplicaciones hospedadas en la misma región de AWS que su dominio de búsqueda disfrutarán de una mayor velocidad de comunicación.
P: ¿Qué es una instancia de búsqueda?
Una instancia de búsqueda es un motor de búsqueda único en la nube que indexa los documentos y responde a las peticiones de búsqueda. Cuenta con una cantidad finita de RAM y recursos de CPU para indexar los datos y procesar las peticiones.
P: ¿Qué es una partición de búsqueda?
Una partición de búsqueda es la parte de los datos que cabe en una única instancia de búsqueda. Un dominio de búsqueda puede tener una o varias particiones de búsqueda y el número de particiones de búsqueda puede cambiar conforme el documento se indexa.
P: ¿Cómo puedo escalar el dominio de búsqueda para que se adapte a las necesidades de mi aplicación?
Los dominios de búsqueda se escalan en dos dimensiones: datos y tráfico. Conforme crece el volumen de datos, necesita más cantidad (o mayor tamaño) de instancias de búsqueda para albergar los datos indexados y el índice se particiona entre las instancias de búsqueda. Conforme aumenta el volumen o la complejidad de la petición, se debe replicar cada una de las particiones de búsqueda para proporcionar capacidad adicional en la CPU para cada partición de búsqueda. Por ejemplo, si los datos requieren tres particiones de búsqueda, tendrá tres instancias de búsqueda en el dominio de búsqueda. Conforme aumenta el tráfico por encima de la capacidad de una única instancia de búsqueda, cada partición se replica para proporcionar capacidad de CPU adicional, lo que añade tres instancias de búsqueda adicionales a su dominio de búsqueda. Si se producen más aumentos en el tráfico, se producirán replicaciones adicionales, hasta un máximo de 5, para cada partición de búsqueda.
P: ¿Cuántos datos puedo cargar en mi dominio de búsqueda?
El número de particiones que necesita depende de los datos y la configuración. Por lo tanto, la carga máxima de datos es la establecida cuando se aplica la configuración de búsqueda y tiene como resultado 10 particiones de búsqueda. Cuando supera el límite de la partición de búsqueda, el dominio dejará de aceptar cargas mientras no se eliminen documentos y se vuelva a indexar el dominio. Si necesita más de 10 particiones de búsqueda, contacte con nosotros.
P: ¿Necesito seleccionar el número y el tipo de instancias de búsqueda para mi dominio de búsqueda?
CloudSearch es un servicio de búsqueda completamente administrado que escala automáticamente el dominio de búsqueda y selecciona el número y el tipo de instancias de búsqueda. Todas las instancias de búsqueda de un dominio de búsqueda determinado son del mismo tipo, el cual puede cambiar a lo largo del tiempo conforme los datos o el tráfico crecen.
También puede configurar las opciones de escalado para un dominio de Amazon CloudSearch a fin de:
- Aumentar la capacidad de carga
- Agilizar las solicitudes de búsqueda
- Aumentar la capacidad de búsqueda
- Mejore la tolerancia a errores
P: ¿Qué tipos de instancias soporta Amazon CloudSearch?
Amazon CloudSearch soporta los siguientes tipos de instancias:
- Instancia de búsqueda pequeña
- Instancia de búsqueda grande
- Instancia de búsqueda extragrande
- Instancia de búsqueda extragrande doble
P: ¿Cómo averiguo el número y el tipo de instancias de búsqueda en mi dominio de búsqueda?
Puede averiguar el número y el tipo de instancias de búsqueda en su dominio de búsqueda mediante la consola de administración de AWS, los AWS SDK o la interfaz de línea de comandos (CLI) de AWS. El número y el tipo de instancias de búsqueda cambian con el tiempo y se escalan de forma automática en un sentido u otro según los datos indexables y el tráfico de búsqueda.
P: ¿Con qué rapidez se escala mi dominio de búsqueda para adaptarse a los cambios en los datos y el tráfico?
Los dominios de búsqueda reaccionan tradicionalmente a aumentos en los cambios de tráfico en minutos. Los cambios en el volumen de datos o en la reducción del tráfico se pueden demorar más, pero es posible acelerar este proceso si se invoca una operación IndexDocuments. Si va a cargar un gran volumen de datos o prevé un aumento del tráfico de consulta, puede escalar previamente el dominio y configurar el tipo de instancia deseado y la cantidad de replicación. Para obtener más información, consulte la sección Configuring Scaling Options en la guía para desarrolladores Amazon CloudSearch Developer Guide.
P: ¿Amazon CloudSearch soporta despliegues Multi-AZ?
Sí. Amazon CloudSearch soporta despliegues en zonas de disponibilidad múltiples (Multi-AZ). Al habilitar la opción Multi-AZ, Amazon CloudSearch ofrece y mantiene instancias adicionales para el dominio de búsqueda en una segunda zona de disponibilidad a fin de garantizar una alta disponibilidad. Las actualizaciones se aplican automáticamente a las instancias en ambas zonas de disponibilidad. El tráfico de búsqueda se distribuye a través de todas las instancias, y las instancias de cada zona pueden gestionar toda la carga en caso de que se produzca algún error.
P: ¿Cómo funciona la nueva característica Multi-AZ? ¿El sistema experimentará algún tiempo de inactividad en caso de que se produzca algún error?
Cuando la opción Multi-AZ está habilitada, las instancias de Amazon CloudSearch de cualquier zona son capaces de gestionar la carga total en caso de que se produzca algún error. Si se interrumpe el servicio o se degradan las instancias de una zona, Amazon CloudSearch redirige todo el tráfico a otra zona de disponibilidad. Las instancias redundantes se restablecen en una zona de disponibilidad independiente sin ninguna intervención administrativa ni interrupciones del servicio.
Algunas consultas en proceso pueden fallar y deberá intentar realizarlas de nuevo. Las actualizaciones enviadas al dominio de búsqueda se almacenan de forma duradera y no se perderán en caso de que se produzca algún error.
P: ¿Un dominio de búsqueda puede implementarse en más de dos zonas de disponibilidad?
No. Un dominio se puede implementar en dos zonas de disponibilidad como máximo.
P: ¿Puedo modificar la configuración de las zonas de disponibilidad múltiples (Multi-AZ) en mi dominio de búsqueda?
Sí. Puede habilitar y deshabilitar la configuración de las zonas de disponibilidad múltiples (Multi-AZ) para los dominios de búsqueda. El servicio no se interrumpe cuando se cambia la configuración.
P: ¿Puedo elegir en qué zonas de disponibilidad implementar mi dominio de búsqueda?
No. En este momento, Amazon CloudSearch elige automáticamente una zona de disponibilidad alternativa en la misma región.
P: ¿Puedo elegir el tipo de instancia que utiliza mi dominio?
Sí. Con la última versión, Amazon CloudSearch le permite especificar el tipo de instancia que desea para el dominio. Si es necesario, Amazon CloudSearch aumentará el escalado del dominio a un tipo de instancia más grande, pero no volverá a reducir el escalado para un tipo de instancia más pequeño.
P: ¿Cuál es la forma más rápida de incluir los datos en CloudSearch?
De forma predeterminada, todos los dominios comienzan en una instancia de búsqueda pequeña. Si necesita cargar un gran volumen de datos, debe escalar previamente el dominio a un tipo de instancia más grande. Para obtener más información, consulte la sección Bulk Uploads en la guía para desarrolladores Amazon CloudSearch Developer Guide.
P: ¿Cómo puedo saber qué tipo de instancia debo elegir para mi configuración inicial?
Para conjuntos de datos con menos de 1 GB de datos o menos de un millón de documentos de 1 KB, comience con la configuración predeterminada de una única instancia de búsqueda pequeña. Para conjuntos de datos más grandes, considere la opción de precalentar el dominio mediante la configuración del tipo de instancia deseado. Para conjuntos de datos de hasta 8 GB, comience con una instancia de búsqueda grande. Para conjuntos de datos de entre 8 GB y 16 GB, comience con una instancia de búsqueda extragrande. Para conjuntos de datos de entre 16 GB y 32 GB, comience con una instancia de búsqueda extragrande doble. Contáctese con nosotros si necesita más capacidad de carga o si tiene que indizar más de 500 GB.
P: ¿Qué características de seguridad adicionales se encuentran disponibles para la nueva versión de Amazon CloudSearch?
Con la última versión, Amazon CloudSearch ahora ofrece la integración de IAM para el servicio de configuración y todos los servicios de dominios de búsqueda. Puede controlar el acceso a acciones específicas de Amazon CloudSearch y requerir la solicitud de autenticación para todas las solicitudes. Las solicitudes se autentican con la firma de la versión de firma 4.
P: ¿Cómo cargo mis datos en Amazon CloudSearch de forma segura?
Envíenos sus datos a través de una conexión SSL segura y cifrada utilizando HTTPS en lugar de HTTP cuando se conecte a Amazon CloudSearch.
P: Mis datos ya están cifrados. ¿Puedo sencillamente enviar los datos cifrados y la clave de cifrado?
No soportamos claves de cifrado generadas por el usuario. Necesitará descifrar los datos y cargarlos a través de HTTPS.
P: ¿Se soportan resultados de búsqueda cifrados?
Sí. Soportamos HTTPS para todas las peticiones de Amazon CloudSearch.
P: ¿Cómo puedo evitar que algunos usuarios específicos obtengan acceso a mi dominio de búsqueda?
Amazon CloudSearch soporta la integración de IAM para el servicio de configuración y todos los servicios de dominios de búsqueda. Puede conceder a los usuarios pleno acceso a Amazon CloudSearch, restringir su acceso a dominios específicos y permitir o denegar el acceso a acciones específicas.
P: ¿Qué cargos y facturación se me aplicarán por utilizar Amazon CloudSearch?
No se requieren cuotas configuradas ni compromisos para comenzar a utilizar el servicio. A final de mes, se le cobrará automáticamente en su tarjeta de crédito el uso de ese mes. Puede ver sus cargos por el periodo de facturación actual en cualquier momento en el sitio web de AWS iniciando sesión en su cuenta de Amazon Web Services y haciendo clic en Actividad de la cuenta, debajo de su cuenta de Web Services.
P: ¿Cuánto cuesta el uso de Amazon CloudSearch?
En este momento, no hay cambios en la estructura de precios para Amazon CloudSearch. Para obtener información detallada sobre precios, consulte la página Precios de Amazon CloudSearch.
P: ¿Hay una versión de prueba gratuita disponible para Amazon CloudSearch?
Sí, hay una versión de prueba gratuita disponible para los nuevos clientes de CloudSearch. Para obtener más información, consulte Amazon CloudSearch – Prueba gratuita de 30 días.
P: ¿Cuánto cuesta el uso de la nueva versión de Amazon CloudSearch?
En este momento, no hay cambios en la estructura de precios para Amazon CloudSearch. Consulte la página Precios para obtener más información.
P: ¿Puede suponer algún ahorro el hecho de utilizar la nueva versión de Amazon CloudSearch?
La última versión de Amazon CloudSearch presenta la compresión de índices avanzados y soporta índices más grandes en cada tipo de instancia. Esto hace que la nueva versión de Amazon CloudSearch resulte más eficaz que la versión anterior y pueda generar un ahorro considerable.
P: ¿Los precios incluyen impuestos?
Si no se especifica lo contrario, nuestros precios no incluyen los impuestos ni gravámenes correspondientes, como el IVA y cualquier otro impuesto sobre las ventas. En el caso de los clientes con una dirección de facturación de Japón, el uso de los servicios de AWS está sujeto al impuesto de consumo nipón. Más información.