Documento de estudo da US15
Introdução
Antes da criação das intents, actions e stories de cada tema selecionado são gerados documentos pela equipe de desenvolvimento que possuem abrangentemente do que aquele ele se trata. Selecionamos um breve conhecimento do tema, possíveis bibliotecas e até mesmo a forma de implementação.
Objetivo
Tendo em vista que os dados passados para o treinamento do bot devem ser bem claros e ter uma quantidade reduzida de informação para não poluir a caixa de mensagens do usuário, o desenvolvedor responsável pelo tema tem como objetivo extrair o máximo de informação e simplifica-la antes de passar para o usuário final. Isso torna a criação das intents, actions e stories mais rápidas e objetivas.
Histograma
1. O que é
Histograma é uma representação gráfica de dados quantitativos. Esses dados são agrupados em classes de frequências de modo que é possivel ilustrar e representar uma amostra de dados e como ela está distribuida.
Para contruir um histograma é necessario que os dados estejam organizados em uma tabela de frequência na qual esta listados os dados e suas respectivas quantidades.
2. Como fazer um histograma
Primeiro é necessário preparar o notebook, importando as bibliotecas necessarias:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
Depois é preciso selecionar e carregar um dataset(amostra):
#caminho do arquivo para carregar
file_path = "../file.csv"
#ler o arquivo e salvar em uma variavel
file_data = pd.read_csv(file_path, index_col="Id")
Para criar o histograma podemos usar o comando sns.distplot
:
#a = escolhe a coluna que quer plotar
#kde = False usa sempre que for criar um histograma
sns.distplot(a=file_path['column'],kde=False)
Ou também o comando sns.kdeplot
para criar um histograma com curvas mais suaves:
#a = escolhe a coluna que quer plotar
#shade = True preenche a area abaixo da curva
sns.kdeplot(a=file_path['column'],shade=True)
Podemos usar o comando input.plot.hist
do pandas também:
#gera dados nos tempos de deslocamento
size, scale = 1000, 10
commutes = pd.Series(np.random.gamma(scale, size=size) ** 1.5)
#plota o histograma
commutes.plot.hist(grid=True, bins=20, rwidth=0.9,
color='#607c8e')