From e523f4a30b55f5e34a47d99a94536702ae77cf15 Mon Sep 17 00:00:00 2001 From: Sourcery AI <> Date: Wed, 12 Apr 2023 14:20:05 +0000 Subject: [PATCH] 'Refactored by Sourcery' --- Semana 2/semana2.py | 5 +- Semana 3/semana3.py | 92 ++++++++++---------- Semana 7/projeto padrao/src/data_source.py | 4 +- Semana 7/projeto padrao/src/preprocessing.py | 2 - 4 files changed, 48 insertions(+), 55 deletions(-) diff --git a/Semana 2/semana2.py b/Semana 2/semana2.py index ce95730..bcd9f6c 100644 --- a/Semana 2/semana2.py +++ b/Semana 2/semana2.py @@ -9,8 +9,7 @@ def get_table_download_link(df): """ csv = df.to_csv(index=False) b64 = base64.b64encode(csv.encode()).decode() # some strings <-> bytes conversions necessary here - href = f'Download csv file' - return href + return f'Download csv file' def main(): st.image('logo.png', width= 200) @@ -45,7 +44,7 @@ def main(): percentual = st.slider('Escolha o limite de percentual faltante limite para as colunas vocë deseja inputar os dados', min_value=0, max_value=100) lista_colunas = list(exploracao[exploracao['NA %'] < percentual]['nomes']) select_method = st.radio('Escolha um metodo abaixo :', ('Média', 'Mediana')) - st.markdown('Você selecionou : ' +str(select_method)) + st.markdown(f'Você selecionou : {str(select_method)}') if select_method == 'Média': df_inputado = df[lista_colunas].fillna(df[lista_colunas].mean()) exploracao_inputado = pd.DataFrame({'nomes': df_inputado.columns, 'tipos': df_inputado.dtypes, 'NA #': df_inputado.isna().sum(), diff --git a/Semana 3/semana3.py b/Semana 3/semana3.py index 0e18f7b..aed0e9f 100644 --- a/Semana 3/semana3.py +++ b/Semana 3/semana3.py @@ -4,36 +4,42 @@ def criar_histograma(coluna, df): - chart = alt.Chart(df, width=600).mark_bar().encode( - alt.X(coluna, bin=True), - y='count()', tooltip=[coluna, 'count()'] - ).interactive() - return chart + return ( + alt.Chart(df, width=600) + .mark_bar() + .encode( + alt.X(coluna, bin=True), y='count()', tooltip=[coluna, 'count()'] + ) + .interactive() + ) def criar_barras(coluna_num, coluna_cat, df): - bars = alt.Chart(df, width = 600).mark_bar().encode( - x=alt.X(coluna_num, stack='zero'), - y=alt.Y(coluna_cat), - tooltip=[coluna_cat, coluna_num] - ).interactive() - return bars + return ( + alt.Chart(df, width=600) + .mark_bar() + .encode( + x=alt.X(coluna_num, stack='zero'), + y=alt.Y(coluna_cat), + tooltip=[coluna_cat, coluna_num], + ) + .interactive() + ) def criar_boxplot(coluna_num, coluna_cat, df): - boxplot = alt.Chart(df, width=600).mark_boxplot().encode( - x=coluna_num, - y=coluna_cat + return ( + alt.Chart(df, width=600) + .mark_boxplot() + .encode(x=coluna_num, y=coluna_cat) ) - return boxplot def criar_scatterplot(x, y, color, df): - scatter = alt.Chart(df, width=800, height=400).mark_circle().encode( - alt.X(x), - alt.Y(y), - color = color, - tooltip = [x, y] - ).interactive() - return scatter + return ( + alt.Chart(df, width=800, height=400) + .mark_circle() + .encode(alt.X(x), alt.Y(y), color=color, tooltip=[x, y]) + .interactive() + ) def cria_correlationplot(df, colunas_numericas): cor_data = (df[colunas_numericas]).corr().stack().reset_index().rename(columns={0: 'correlation', 'level_0': 'variable', 'level_1': 'variable2'}) @@ -65,53 +71,45 @@ def main(): col = st.selectbox('Selecione a coluna :', colunas_numericas) if col is not None: st.markdown('Selecione o que deseja analisar :') - mean = st.checkbox('Média') - if mean: + if mean := st.checkbox('Média'): st.markdown(df[col].mean()) - median = st.checkbox('Mediana') - if median: + if median := st.checkbox('Mediana'): st.markdown(df[col].median()) - desvio_pad = st.checkbox('Desvio padrão') - if desvio_pad: + if desvio_pad := st.checkbox('Desvio padrão'): st.markdown(df[col].std()) - kurtosis = st.checkbox('Kurtosis') - if kurtosis: + if kurtosis := st.checkbox('Kurtosis'): st.markdown(df[col].kurtosis()) - skewness = st.checkbox('Skewness') - if skewness: + if skewness := st.checkbox('Skewness'): st.markdown(df[col].skew()) - describe = st.checkbox('Describe') - if describe: + if describe := st.checkbox('Describe'): st.table(df[colunas_numericas].describe().transpose()) st.subheader('Visualização dos dados') st.image('https://media.giphy.com/media/Rkoat5KMaw2aOHDduz/giphy.gif', width=200) st.markdown('Selecione a visualizacao') - histograma = st.checkbox('Histograma') - if histograma: + if histograma := st.checkbox('Histograma'): col_num = st.selectbox('Selecione a Coluna Numerica: ', colunas_numericas,key = 'unique') - st.markdown('Histograma da coluna : ' + str(col_num)) + st.markdown(f'Histograma da coluna : {str(col_num)}') st.write(criar_histograma(col_num, df)) - barras = st.checkbox('Gráfico de barras') - if barras: + if barras := st.checkbox('Gráfico de barras'): col_num_barras = st.selectbox('Selecione a coluna numerica: ', colunas_numericas, key = 'unique') col_cat_barras = st.selectbox('Selecione uma coluna categorica : ', colunas_object, key = 'unique') - st.markdown('Gráfico de barras da coluna ' + str(col_cat_barras) + ' pela coluna ' + col_num_barras) + st.markdown( + f'Gráfico de barras da coluna {str(col_cat_barras)} pela coluna ' + + col_num_barras + ) st.write(criar_barras(col_num_barras, col_cat_barras, df)) - boxplot = st.checkbox('Boxplot') - if boxplot: + if boxplot := st.checkbox('Boxplot'): col_num_box = st.selectbox('Selecione a Coluna Numerica:', colunas_numericas,key = 'unique' ) col_cat_box = st.selectbox('Selecione uma coluna categorica : ', colunas_object, key = 'unique') - st.markdown('Boxplot ' + str(col_cat_box) + ' pela coluna ' + col_num_box) + st.markdown(f'Boxplot {str(col_cat_box)} pela coluna ' + col_num_box) st.write(criar_boxplot(col_num_box, col_cat_box, df)) - scatter = st.checkbox('Scatterplot') - if scatter: + if scatter := st.checkbox('Scatterplot'): col_num_x = st.selectbox('Selecione o valor de x ', colunas_numericas, key = 'unique') col_num_y = st.selectbox('Selecione o valor de y ', colunas_numericas, key = 'unique') col_color = st.selectbox('Selecione a coluna para cor', colunas) st.markdown('Selecione os valores de x e y') st.write(criar_scatterplot(col_num_x, col_num_y, col_color, df)) - correlacao = st.checkbox('Correlacao') - if correlacao: + if correlacao := st.checkbox('Correlacao'): st.markdown('Gráfico de correlação das colunas númericas') st.write(cria_correlationplot(df, colunas_numericas)) diff --git a/Semana 7/projeto padrao/src/data_source.py b/Semana 7/projeto padrao/src/data_source.py index 44e1f65..39018ce 100644 --- a/Semana 7/projeto padrao/src/data_source.py +++ b/Semana 7/projeto padrao/src/data_source.py @@ -16,9 +16,7 @@ def read_data(self, etapa_treino=True): ''' if etapa_treino: - df = pd.read_csv(self.path_train) - return df - + return pd.read_csv(self.path_train) df = pd.read_csv(self.path_test) y = pd.read_csv(self.path_label) return df, y diff --git a/Semana 7/projeto padrao/src/preprocessing.py b/Semana 7/projeto padrao/src/preprocessing.py index a1328e1..94d209b 100644 --- a/Semana 7/projeto padrao/src/preprocessing.py +++ b/Semana 7/projeto padrao/src/preprocessing.py @@ -35,8 +35,6 @@ def process(self, df, etapa_treino=True): print('Removing target') if etapa_treino == True: numeric_features.remove('SalePrice') - else: - pass print('Feature encoder') print('Feature Normalization and Encoding') std_scaler = StandardScaler()