Skip to content

Commit 52bcf93

Browse files
committed
Add query examples
1 parent f1836f7 commit 52bcf93

File tree

1 file changed

+60
-14
lines changed

1 file changed

+60
-14
lines changed

kibana/tdc-connections-2021/README.md

Lines changed: 60 additions & 14 deletions
Original file line numberDiff line numberDiff line change
@@ -38,7 +38,7 @@ PUT /autores
3838
"tokenizer": "standard",
3939
"filter": [
4040
"lowercase",
41-
"asciifolding",
41+
"asciifolding"
4242
]
4343
}
4444
}
@@ -141,7 +141,13 @@ PUT /livros
141141
"copy_to": [
142142
"todos"
143143
]
144-
}
144+
},
145+
"autores": {
146+
"type": "text",
147+
"copy_to": [
148+
"todos"
149+
]
150+
},
145151
"avaliacao": {
146152
"type": "float"
147153
}
@@ -197,6 +203,12 @@ PUT /artigos
197203
"todos"
198204
]
199205
},
206+
"autores": {
207+
"type": "text",
208+
"copy_to": [
209+
"todos"
210+
]
211+
},
200212
"avaliacao": {
201213
"type": "float"
202214
}
@@ -207,7 +219,8 @@ PUT /artigos
207219
POST /_aliases
208220
{
209221
"actions" : [
210-
{ "add" : { "indices" : ["autores", "artigos", "livros"], "alias" : "busca-geral" } }
222+
{ "add" : { "indices" : ["autores", "artigos", "livros"], "alias" : "busca-geral" } },
223+
{ "add" : { "indices" : ["artigos", "livros"], "alias" : "busca-artigos-livros" } },
211224
]
212225
}
213226
@@ -433,12 +446,32 @@ POST /autores/_bulk
433446
434447
POST /livros/_bulk
435448
{"index":{}}
436-
{}
449+
{"titulo": "Recuperação de Informação: Conceitos e Tecnologia das Máquinas de Busca", "descricao": "Diariamente, mais de 1 bilhão de pessoas recorrem às máquinas de busca para encontrar informações. Mas o que está por trás dessa tecnologia? Ricardo Baeza-Yates e Berthier Ribeiro-Neto respondem a esse questionamento neste livro, que é uma introdução integral e atualizada dos conceitos-chave de RI e das tecnologias subjacentes às máquinas de busca. Desde a análise (parse) até a indexação, do agrupamento à classificação, da recuperação à geração do ranking, da realimentação até a avaliação da recuperação, todos os conceitos mais importantes são cuidadosamente introduzidos e exemplificados.", "assunto": "Recuperação da Informação", "autores": ["Ricardo Baeza-Yates", "Berthier Ribeiro-Neto"], "avaliacao": 10}
450+
{"index":{}}
451+
{"titulo": "Manual de Algoritmos e Estruturas de Dados em Pascal e C", "descricao": "Esta segunda edição reúne muitos algoritmos úteis e suas estruturas de dados associadas em uma referência única e útil, apresentando uma nova seção sobre algoritmos de manipulação de texto e cobertura expandida de algoritmos aritméticos. Cada algoritmo é codificado em C e Pascal.", "assunto": ["Algoritmos", "Estruturas de Dados", "Pascal", "C"], "autores": ["Ricardo Baeza-Yates", "Gaston Gonnet"], "avaliacao": 7}
452+
{"index":{}}
453+
{"titulo": "O ambiente de programação Unix", "descricao": "Projetado para usuários inexperientes e experientes, este livro descreve o ambiente de programação UNIX® e a filosofia em detalhes. TÓPICOS-CHAVE: Os leitores obterão uma compreensão não apenas de como usar o sistema, seus componentes e os programas, mas também como eles se encaixam no ambiente total.", "assunto": "Unix", "autores": ["Brian W. Kernighan", "Rob Pike"], "avaliacao": 10}
454+
{"index":{}}
455+
{"titulo": "A Prática da Programação", "descricao": "A prática de programação é mais do que apenas escrever código. Os programadores também devem avaliar as compensações, escolher entre alternativas de design, depurar e testar, melhorar o desempenho e manter o software escrito por eles e outros. Ao mesmo tempo, eles devem se preocupar com questões como compatibilidade, robustez e confiabilidade, ao mesmo tempo em que atendem às especificações. A Prática de Programação cobre todos esses tópicos e muito mais. Este livro está repleto de conselhos práticos e exemplos do mundo real em C, C ++, Java e uma variedade de linguagens de propósito especial.", "assunto": "Programação", "autores": ["Brian W. Kernighan", "Rob Pike"], "avaliacao": 9.2}
456+
{"index":{}}
457+
{"titulo": "Steve Jobs: The Exclusive Biography", "descricao": "Com base em mais de quarenta entrevistas com Steve Jobs conduzidas ao longo de dois anos - bem como entrevistas com mais de 100 membros da família, amigos, adversários, concorrentes e colegas - Walter Isaacson escreveu uma história fascinante da vida na montanha-russa e extremamente intensa personalidade de um empreendedor criativo cuja paixão pela perfeição e ímpeto feroz revolucionou seis setores: computadores pessoais, filmes animados, música, telefones, tablets e editoração digital. O retrato de Isaacson tocou milhões de leitores.", "assunto": "Biografia", "autores": "Walter Isaacson", "avaliacao": 10}
437458
438459
439460
POST /artigos/_bulk
440461
{"index":{}}
441-
{}
462+
{"titulo":"Bias on the Web","descricao":"Nossa tendência humana inerente de favorecer uma coisa ou opinião em detrimento de outra se reflete em todos os aspectos de nossas vidas, criando preconceitos latentes e evidentes em relação a tudo o que vemos, ouvimos e fazemos.","conteudo":"Nossa tendência humana inerente de favorecer uma coisa ou opinião em detrimento de outra se reflete em todos os aspectos de nossas vidas, criando preconceitos latentes e evidentes em relação a tudo o que vemos, ouvimos e fazemos. Qualquer remédio para o preconceito deve começar com a consciência de que existe um preconceito; por exemplo, a maioria das sociedades maduras aumenta a conscientização sobre o preconceito social por meio de programas de ação afirmativa e, embora a conscientização por si só não alivie completamente o problema, ajuda a nos guiar em direção a uma solução. O preconceito na Web reflete preconceitos sociais e internos dentro de nós, emergindo de maneiras mais sutis. Este artigo tem como objetivo aumentar a consciência sobre os efeitos potenciais impostos a todos nós por meio do preconceito presente no uso e no conteúdo da Web. Devemos, portanto, considerá-lo e explicá-lo no projeto de sistemas da Web que realmente atendam às necessidades das pessoas. Bias está intrinsecamente inserido na cultura e na história desde o início dos tempos. No entanto, devido ao aumento dos dados digitais, agora eles podem se espalhar mais rápido do que nunca e atingir muito mais pessoas. Isso fez com que o enviesamento de big data se tornasse um tópico de tendência e polêmico nos últimos anos. As minorias, especialmente, sentiram os efeitos prejudiciais do viés de dados ao perseguir objetivos de vida, com resultados regidos principalmente por algoritmos, de empréstimos hipotecários à personalização de publicidade.24 Embora os obstáculos que enfrentam continuem a ser um obstáculo importante, o viés afeta a todos nós, embora muito de o tempo em que não temos conhecimento de sua existência ou como pode (negativamente) influenciar nosso julgamento e comportamento. A Web é o canal de comunicação mais proeminente da atualidade, bem como um lugar para onde convergem nossos preconceitos. Como as mídias sociais estão cada vez mais no centro da vida diária, elas nos expõem a influenciadores que talvez não tivéssemos encontrado antes. Isso torna a compreensão e o reconhecimento de preconceitos na Web mais essenciais do que nunca. Meu principal objetivo aqui é, portanto, aumentar o nível de conscientização para todos os vieses da web. A percepção do preconceito nos ajudaria a projetar melhores sistemas baseados na Web, bem como sistemas de software em geral.","autores":"Ricardo Baeza-Yates","avaliacao":10}
463+
{"index":{}}
464+
{"titulo":"Algoritmos: um artigo em espanhol sobre algoritmos básicos, incluindo alguns problemas simples e agradáveis.","descricao":"Algoritmo, de acordo com a Royal Academy, é um conjunto ordenado e finito de operações que permite encontre a solução para qualquer problema. Exemplos simples de algoritmos são uma receita para cozinhar ou as instruções para montar uma bicicleta.","conteudo":"Algoritmo, de acordo com a Royal Academy, é um conjunto ordenado e finito de operações que permite encontre a solução para qualquer problema. Exemplos simples de algoritmos são uma receita para cozinhar ou as instruções para montar uma bicicleta. Os primeiros algoritmos registrados datam de Babylon, originou-se na matemática como um método de resolver um problema usando um sequência de cálculos mais simples. Esta palavra tem sua origem no nome de um famoso Matemático e estudioso árabe do século 9, Al-Khorezmi, a quem também devemos as palavras figuras e álgebra (ver anexo). Atualmente o algoritmo é usado para nomear a sequência de etapas a seguir para resolver um problema usando um computador (computador). Por esta razão, algoritmo ou ciência de algoritmos, é um dos pilares da ciência da computação (ciência da computação em inglês). Neste artigo, veremos diferentes tipos de algoritmos e diferentes técnicas para resolver problemas em através de vários exemplos, muitos deles não computacionais. Todos os exemplos resolvem variantes de um problema genérico: a busca de informações, dilema que vivemos diariamente. O o objetivo final será encontrar o algoritmo que usa menos operações ou gasta menos recursos, dependendo do caso. Design e análise de algoritmos O desenvolvimento de um algoritmo tem várias etapas (veja a figura). Primeiro, o problema é modelado precisa resolver, então a solução é desenhada, então é analisada para determinar seu grau de correção e eficiência, e é finalmente traduzido em instruções em um programação que um computador irá entender. O modelo especifica todas as suposições sobre o dados de entrada e a capacidade computacional do algoritmo. O design é baseado em diferentes métodos de solução de problemas, muitos dos quais serão apresentados posteriormente. Para o análise de um algoritmo, devemos estudar quantas operações são realizadas para resolver um dificuldade. Se tivermos um problema x, diremos que o algoritmo realiza operações A (x) (custo de algoritmo). O valor máximo de A (x) é denominado pior caso e o mínimo, melhor caso. No Na prática, o pior caso é interessante, pois representa um limite superior ao custo do algoritmo. Sem No entanto, em muitos problemas, isso ocorre com pouca frequência ou existe apenas na teoria. Então estuda a média de A (x), para a qual é necessário definir a probabilidade de que cada x ocorra, p (x), e calcule a soma ponderada de p (x) por A (x). Embora esta medição seja muito mais realista, muitas vezes é difícil calcular e outras vezes não podemos nem definir p (x) porque não sabemos ou realidade ou é muito difícil modelar. Se pudermos mostrar que não há algoritmo que realizar menos operações para resolver um problema, o algoritmo é considerado ótimo, seja em pior caso ou caso médio, dependendo do modelo. Por este motivo, a análise realimenta para projetar, para melhorar o algoritmo.","autores":"Ricardo Baeza-Yates","avaliacao":8.9}
465+
{"index":{}}
466+
{"titulo":"Cache de dois níveis com preservação de classificação para mecanismos de pesquisa escalonáveis","descricao":"Apresentamos um esquema de armazenamento em cache eficaz que reduz os requisitos de computação e E / S de um mecanismo de pesquisa da Web sem alterar suas características de classificação. A novidade é um esquema de cache de dois níveis que combina simultaneamente resultados de consulta em cache e listas invertidas em cache em um mecanismo de busca de casos reais.","conteudo":"Apresentamos um esquema de armazenamento em cache eficaz que reduz os requisitos de computação e E / S de um mecanismo de pesquisa da Web sem alterar suas características de classificação. A novidade é um esquema de cache de dois níveis que combina simultaneamente resultados de consulta em cache e listas invertidas em cache em um mecanismo de busca de casos reais. Um conjunto de consultas de log é usado para medir e comparar o desempenho e a escalabilidade do mecanismo de pesquisa sem cache, com o cache para resultados da consulta, com o cache para listas invertidas e com o cache de dois níveis. Resultados experimentais mostram que o cache de dois níveis é superior e permite aumentar o número máximo de consultas processadas por segundo em um fator de três, preservando o tempo de resposta. Esses resultados são novos, não foram relatados antes e demonstram a importância de esquemas de cache avançados para mecanismos de pesquisa de casos reais.","autores":["Patricia Correia Saraiva","Edleno Silva de Moura","Nivio Ziviani","Wagner Meira","Rodrigo Fonseca","Berthier Ribeiro-Neto"],"avaliacao":9.2}
467+
{"index":{}}
468+
{"titulo":"Classificação de pesquisa eficiente em redes sociais","descricao":"Anais da décima sexta conferência ACM sobre Conferência sobre gestão de informação e conhecimento","conteudo":"Em redes sociais como Orkut, www. orkut. com, uma grande parte das consultas de usuários referem-se a nomes de outras pessoas. Na verdade, mais de 50% das consultas no Orkut são sobre nomes de outros usuários, com uma média de 1,8 termos por consulta. Além disso, os usuários geralmente procuram pessoas com quem mantêm relacionamento na rede. Esses relacionamentos podem ser modelados como arestas em um gráfico de amizade, um gráfico no qual os nós representam os usuários. Nesse contexto, o ranking de busca pode ser modelado como uma função que depende das distâncias entre os usuários no gráfico, mais especificamente, dos caminhos mais curtos no gráfico de amizade. No entanto, a aplicação dessa ideia à classificação não é direta porque o grande tamanho das redes sociais modernas (dezenas de milhões de usuários) impede o cálculo eficiente dos caminhos mais curtos no momento da consulta. Superamos isso criando uma fórmula de classificação que estabelece um equilíbrio entre","autores":["Monique V Vieira","Bruno M Fonseca","Rodrigo Damazio","Paulo B Golgher","Davi de Castro Reis","Berthier Ribeiro-Neto"],"avaliacao":7.9}
469+
{"index":{}}
470+
{"titulo":"Usando regras de associação para descobrir consultas relacionadas a mecanismos de pesquisa","descricao":"Apresentamos um método para geração automática de sugestões de consultas relacionadas enviadas aos motores de busca da web.","conteudo":"Apresentamos um método para geração automática de sugestões de consultas relacionadas enviadas aos motores de busca da web. O método extrai informações do registro de consultas anteriores enviadas para mecanismos de pesquisa usando algoritmos para mineração de regras de associação. Os resultados experimentais foram realizados em um log contendo mais de 2,3 milhões de consultas submetidas a um motor de busca comercial, dando sugestões corretas em 90,5% das 5 principais sugestões apresentadas para consultas comuns extraídas de um log real.","autores":["Bruno M Fonseca","Paulo Braz Golgher","Edleno Silva de Moura","Nivio Ziviani"],"avaliacao":9.9}
471+
{"index":{}}
472+
{"titulo":"Fontes Go","descricao":"O kit de ferramentas de interface do usuário experimental que está sendo construído em golang.org/x/exp/shiny inclui vários elementos de texto, mas há um problema em testá-los: qual fonte deve ser usada?","conteudo":"O kit de ferramentas de interface do usuário experimental que está sendo construído em golang.org/x/exp/shiny inclui vários elementos de texto, mas há um problema em testá-los: qual fonte deve ser usada? A resposta a essa pergunta nos levou ao anúncio de hoje, o lançamento de uma família de fontes WGL4 TrueType de alta qualidade, criada pela Bigelow & Holmes type foundry especificamente para o projeto Go. A família da fonte, chamada Go (naturalmente), inclui faces de largura fixa e proporcional em renderizações normal, negrito e itálico. As fontes foram testadas para usos técnicos, particularmente programação. O código-fonte Go parece particularmente bom quando exibido em fontes Go, como o próprio nome indica, com coisas como caracteres de pontuação facilmente distinguíveis e operadores alinhados e colocados de forma consistente:","autores":["Nigel Tao","Chuck Bigelow","Rob Pike"],"avaliacao":8.9}
473+
474+
442475
```
443476

444477

@@ -469,21 +502,34 @@ GET /busca-geral/_search
469502
GET /busca-geral/_search
470503
{
471504
"query": {
472-
"range": {
473-
"avaliacao": {
474-
"gte": 2,
475-
"lte": 9
476-
}
505+
"query_string": {
506+
"query":"Algoritmos Recuperação",
507+
"fields": ["todos"]
477508
}
478509
}
479510
}
480511
481-
GET /busca-geral/_search
512+
GET /busca-artigos-livros/_search
482513
{
483514
"query": {
484-
"query_string": {
485-
"query":"informação",
486-
"fields": ["todos"]
515+
"bool": {
516+
"must": [
517+
{
518+
"query_string": {
519+
"query": "Algoritmos -Recuperação",
520+
"fields": [
521+
"todos"
522+
]
523+
}
524+
},
525+
{
526+
"range": {
527+
"avaliacao": {
528+
"gte": 6,
529+
"lte": 10
530+
}
531+
}
532+
]
487533
}
488534
}
489535
}

0 commit comments

Comments
 (0)