From e523f4a30b55f5e34a47d99a94536702ae77cf15 Mon Sep 17 00:00:00 2001
From: Sourcery AI <>
Date: Wed, 12 Apr 2023 14:20:05 +0000
Subject: [PATCH] 'Refactored by Sourcery'
---
Semana 2/semana2.py | 5 +-
Semana 3/semana3.py | 92 ++++++++++----------
Semana 7/projeto padrao/src/data_source.py | 4 +-
Semana 7/projeto padrao/src/preprocessing.py | 2 -
4 files changed, 48 insertions(+), 55 deletions(-)
diff --git a/Semana 2/semana2.py b/Semana 2/semana2.py
index ce95730..bcd9f6c 100644
--- a/Semana 2/semana2.py
+++ b/Semana 2/semana2.py
@@ -9,8 +9,7 @@ def get_table_download_link(df):
"""
csv = df.to_csv(index=False)
b64 = base64.b64encode(csv.encode()).decode() # some strings <-> bytes conversions necessary here
- href = f'Download csv file'
- return href
+ return f'Download csv file'
def main():
st.image('logo.png', width= 200)
@@ -45,7 +44,7 @@ def main():
percentual = st.slider('Escolha o limite de percentual faltante limite para as colunas vocë deseja inputar os dados', min_value=0, max_value=100)
lista_colunas = list(exploracao[exploracao['NA %'] < percentual]['nomes'])
select_method = st.radio('Escolha um metodo abaixo :', ('Média', 'Mediana'))
- st.markdown('Você selecionou : ' +str(select_method))
+ st.markdown(f'Você selecionou : {str(select_method)}')
if select_method == 'Média':
df_inputado = df[lista_colunas].fillna(df[lista_colunas].mean())
exploracao_inputado = pd.DataFrame({'nomes': df_inputado.columns, 'tipos': df_inputado.dtypes, 'NA #': df_inputado.isna().sum(),
diff --git a/Semana 3/semana3.py b/Semana 3/semana3.py
index 0e18f7b..aed0e9f 100644
--- a/Semana 3/semana3.py
+++ b/Semana 3/semana3.py
@@ -4,36 +4,42 @@
def criar_histograma(coluna, df):
- chart = alt.Chart(df, width=600).mark_bar().encode(
- alt.X(coluna, bin=True),
- y='count()', tooltip=[coluna, 'count()']
- ).interactive()
- return chart
+ return (
+ alt.Chart(df, width=600)
+ .mark_bar()
+ .encode(
+ alt.X(coluna, bin=True), y='count()', tooltip=[coluna, 'count()']
+ )
+ .interactive()
+ )
def criar_barras(coluna_num, coluna_cat, df):
- bars = alt.Chart(df, width = 600).mark_bar().encode(
- x=alt.X(coluna_num, stack='zero'),
- y=alt.Y(coluna_cat),
- tooltip=[coluna_cat, coluna_num]
- ).interactive()
- return bars
+ return (
+ alt.Chart(df, width=600)
+ .mark_bar()
+ .encode(
+ x=alt.X(coluna_num, stack='zero'),
+ y=alt.Y(coluna_cat),
+ tooltip=[coluna_cat, coluna_num],
+ )
+ .interactive()
+ )
def criar_boxplot(coluna_num, coluna_cat, df):
- boxplot = alt.Chart(df, width=600).mark_boxplot().encode(
- x=coluna_num,
- y=coluna_cat
+ return (
+ alt.Chart(df, width=600)
+ .mark_boxplot()
+ .encode(x=coluna_num, y=coluna_cat)
)
- return boxplot
def criar_scatterplot(x, y, color, df):
- scatter = alt.Chart(df, width=800, height=400).mark_circle().encode(
- alt.X(x),
- alt.Y(y),
- color = color,
- tooltip = [x, y]
- ).interactive()
- return scatter
+ return (
+ alt.Chart(df, width=800, height=400)
+ .mark_circle()
+ .encode(alt.X(x), alt.Y(y), color=color, tooltip=[x, y])
+ .interactive()
+ )
def cria_correlationplot(df, colunas_numericas):
cor_data = (df[colunas_numericas]).corr().stack().reset_index().rename(columns={0: 'correlation', 'level_0': 'variable', 'level_1': 'variable2'})
@@ -65,53 +71,45 @@ def main():
col = st.selectbox('Selecione a coluna :', colunas_numericas)
if col is not None:
st.markdown('Selecione o que deseja analisar :')
- mean = st.checkbox('Média')
- if mean:
+ if mean := st.checkbox('Média'):
st.markdown(df[col].mean())
- median = st.checkbox('Mediana')
- if median:
+ if median := st.checkbox('Mediana'):
st.markdown(df[col].median())
- desvio_pad = st.checkbox('Desvio padrão')
- if desvio_pad:
+ if desvio_pad := st.checkbox('Desvio padrão'):
st.markdown(df[col].std())
- kurtosis = st.checkbox('Kurtosis')
- if kurtosis:
+ if kurtosis := st.checkbox('Kurtosis'):
st.markdown(df[col].kurtosis())
- skewness = st.checkbox('Skewness')
- if skewness:
+ if skewness := st.checkbox('Skewness'):
st.markdown(df[col].skew())
- describe = st.checkbox('Describe')
- if describe:
+ if describe := st.checkbox('Describe'):
st.table(df[colunas_numericas].describe().transpose())
st.subheader('Visualização dos dados')
st.image('https://media.giphy.com/media/Rkoat5KMaw2aOHDduz/giphy.gif', width=200)
st.markdown('Selecione a visualizacao')
- histograma = st.checkbox('Histograma')
- if histograma:
+ if histograma := st.checkbox('Histograma'):
col_num = st.selectbox('Selecione a Coluna Numerica: ', colunas_numericas,key = 'unique')
- st.markdown('Histograma da coluna : ' + str(col_num))
+ st.markdown(f'Histograma da coluna : {str(col_num)}')
st.write(criar_histograma(col_num, df))
- barras = st.checkbox('Gráfico de barras')
- if barras:
+ if barras := st.checkbox('Gráfico de barras'):
col_num_barras = st.selectbox('Selecione a coluna numerica: ', colunas_numericas, key = 'unique')
col_cat_barras = st.selectbox('Selecione uma coluna categorica : ', colunas_object, key = 'unique')
- st.markdown('Gráfico de barras da coluna ' + str(col_cat_barras) + ' pela coluna ' + col_num_barras)
+ st.markdown(
+ f'Gráfico de barras da coluna {str(col_cat_barras)} pela coluna '
+ + col_num_barras
+ )
st.write(criar_barras(col_num_barras, col_cat_barras, df))
- boxplot = st.checkbox('Boxplot')
- if boxplot:
+ if boxplot := st.checkbox('Boxplot'):
col_num_box = st.selectbox('Selecione a Coluna Numerica:', colunas_numericas,key = 'unique' )
col_cat_box = st.selectbox('Selecione uma coluna categorica : ', colunas_object, key = 'unique')
- st.markdown('Boxplot ' + str(col_cat_box) + ' pela coluna ' + col_num_box)
+ st.markdown(f'Boxplot {str(col_cat_box)} pela coluna ' + col_num_box)
st.write(criar_boxplot(col_num_box, col_cat_box, df))
- scatter = st.checkbox('Scatterplot')
- if scatter:
+ if scatter := st.checkbox('Scatterplot'):
col_num_x = st.selectbox('Selecione o valor de x ', colunas_numericas, key = 'unique')
col_num_y = st.selectbox('Selecione o valor de y ', colunas_numericas, key = 'unique')
col_color = st.selectbox('Selecione a coluna para cor', colunas)
st.markdown('Selecione os valores de x e y')
st.write(criar_scatterplot(col_num_x, col_num_y, col_color, df))
- correlacao = st.checkbox('Correlacao')
- if correlacao:
+ if correlacao := st.checkbox('Correlacao'):
st.markdown('Gráfico de correlação das colunas númericas')
st.write(cria_correlationplot(df, colunas_numericas))
diff --git a/Semana 7/projeto padrao/src/data_source.py b/Semana 7/projeto padrao/src/data_source.py
index 44e1f65..39018ce 100644
--- a/Semana 7/projeto padrao/src/data_source.py
+++ b/Semana 7/projeto padrao/src/data_source.py
@@ -16,9 +16,7 @@ def read_data(self, etapa_treino=True):
'''
if etapa_treino:
- df = pd.read_csv(self.path_train)
- return df
-
+ return pd.read_csv(self.path_train)
df = pd.read_csv(self.path_test)
y = pd.read_csv(self.path_label)
return df, y
diff --git a/Semana 7/projeto padrao/src/preprocessing.py b/Semana 7/projeto padrao/src/preprocessing.py
index a1328e1..94d209b 100644
--- a/Semana 7/projeto padrao/src/preprocessing.py
+++ b/Semana 7/projeto padrao/src/preprocessing.py
@@ -35,8 +35,6 @@ def process(self, df, etapa_treino=True):
print('Removing target')
if etapa_treino == True:
numeric_features.remove('SalePrice')
- else:
- pass
print('Feature encoder')
print('Feature Normalization and Encoding')
std_scaler = StandardScaler()