Bulletdev
diff --git a/‎.gitignore‎
Lines changed: 2 additions & 0 deletions b/‎.gitignore‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎.idea/.gitignore‎
Lines changed: 8 additions & 0 deletions b/‎.idea/.gitignore‎
Lines changed: 8 additions & 0 deletions
diff --git a/‎.idea/compiler.xml‎
Lines changed: 13 additions & 0 deletions b/‎.idea/compiler.xml‎
Lines changed: 13 additions & 0 deletions
diff --git a/‎.idea/encodings.xml‎
Lines changed: 7 additions & 0 deletions b/‎.idea/encodings.xml‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎.idea/inspectionProfiles/Project_Default.xml‎
Lines changed: 10 additions & 0 deletions b/‎.idea/inspectionProfiles/Project_Default.xml‎
Lines changed: 10 additions & 0 deletions
diff --git a/‎.idea/jarRepositories.xml‎
Lines changed: 20 additions & 0 deletions b/‎.idea/jarRepositories.xml‎
Lines changed: 20 additions & 0 deletions
diff --git a/‎.idea/misc.xml‎
Lines changed: 12 additions & 0 deletions b/‎.idea/misc.xml‎
Lines changed: 12 additions & 0 deletions
diff --git a/‎pom.xml‎
Lines changed: 74 additions & 0 deletions b/‎pom.xml‎
Lines changed: 74 additions & 0 deletions
diff --git a/‎readme.md‎
Lines changed: 177 additions & 0 deletions b/‎readme.md‎
Lines changed: 177 additions & 0 deletions
@@ -0,0 +1,2 @@
+# Project exclude paths
+/target/
@@ -0,0 +1,74 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project xmlns="http://maven.apache.org/POM/4.0.0"
+         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
+         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
+    <modelVersion>4.0.0</modelVersion>
+
+    <groupId>com.dataanalyzer</groupId>
+    <artifactId>java-spark-data-analyzer</artifactId>
+    <version>1.0-SNAPSHOT</version>
+
+    <properties>
+        <maven.compiler.source>11</maven.compiler.source>
+        <maven.compiler.target>11</maven.compiler.target>
+        <spark.version>3.4.1</spark.version>
+        <scala.version>2.12</scala.version>
+        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
+    </properties>
+
+    <dependencies>
+        <!-- Apache Spark Core -->
+        <dependency>
+            <groupId>org.apache.spark</groupId>
+            <artifactId>spark-core_${scala.version}</artifactId>
+            <version>${spark.version}</version>
+        </dependency>
+
+        <!-- Apache Spark SQL -->
+        <dependency>
+            <groupId>org.apache.spark</groupId>
+            <artifactId>spark-sql_${scala.version}</artifactId>
+            <version>${spark.version}</version>
+        </dependency>
+    </dependencies>
+
+    <build>
+        <plugins>
+            <plugin>
+                <groupId>org.apache.maven.plugins</groupId>
+                <artifactId>maven-compiler-plugin</artifactId>
+                <version>3.10.1</version>
+                <configuration>
+                    <source>${maven.compiler.source}</source>
+                    <target>${maven.compiler.target}</target>
+                </configuration>
+            </plugin>
+
+            <!-- Maven Assembly Plugin para criar um JAR executável com todas as dependências -->
+            <plugin>
+                <groupId>org.apache.maven.plugins</groupId>
+                <artifactId>maven-assembly-plugin</artifactId>
+                <version>3.4.2</version>
+                <configuration>
+                    <archive>
+                        <manifest>
+                            <mainClass>com.dataanalyzer.DataAnalyzer</mainClass>
+                        </manifest>
+                    </archive>
+                    <descriptorRefs>
+                        <descriptorRef>jar-with-dependencies</descriptorRef>
+                    </descriptorRefs>
+                </configuration>
+                <executions>
+                    <execution>
+                        <id>make-assembly</id>
+                        <phase>package</phase>
+                        <goals>
+                            <goal>single</goal>
+                        </goals>
+                    </execution>
+                </executions>
+            </plugin>
+        </plugins>
+    </build>
+</project>
@@ -0,0 +1,177 @@
+# 🕵️ Java Spark Data Analyzer
+
+<div align="center">
+
+![Java](https://img.shields.io/badge/Java-11+-orange.svg)
+![Apache Spark](https://img.shields.io/badge/Apache%20Spark-3.4.1-blue.svg)
+![License](https://img.shields.io/badge/License-MIT-green.svg)
+
+**Um aplicativo Java de análise de dados com Apache Spark que compete diretamente com soluções em Python.**
+
+</div>
+
+---
+
+## ✨ Principais Funcionalidades
+
+- 📊 **Carregamento intuitivo de dados** - Suporte para CSV com diversas opções de configuração
+- 🔍 **Visualização interativa** - Exibição de schemas, amostras e estatísticas descritivas
+- 🔄 **Transformações poderosas** - Seleção de colunas, criação de novas colunas, renomeação e ordenação
+- 🔎 **Filtros avançados** - Aplicação de condições para filtrar dados com precisão
+- 📈 **Agregações flexíveis** - Funções como média, soma, mínimo, máximo e contagem
+- ⚙️ **Tratamento de dados** - Remoção eficiente de duplicatas e valores nulos
+- 💾 **Múltiplos formatos de exportação** - Salvamento em CSV, Parquet e JSON
+
+## 📋 Requisitos
+
+- Java 8 ou 11 (recomendado)
+- Java 17+ (requer configurações adicionais)
+- Apache Maven
+- Memória suficiente para processar seus conjuntos de dados
+
+## ⚙️ Configurações por Versão do Java
+
+### Java 8 ou 11 (Recomendado)
+Java 8 ou 11 funcionam diretamente sem configurações adicionais.
+
+### Java 17+
+Para usar com Java 17 ou superior, é necessário adicionar as seguintes opções JVM:
+```bash
+--add-opens=java.base/java.nio=ALL-UNNAMED
+--add-opens=java.base/sun.nio.ch=ALL-UNNAMED
+--add-opens=java.base/java.util=ALL-UNNAMED
+--add-opens=java.base/java.lang.invoke=ALL-UNNAMED
+--add-opens=java.base/java.util.concurrent=ALL-UNNAMED
+```
+
+## 🔧 Instalação
+
+1. Clone o repositório:
+```bash
+git clone https://github.com/bulletdev/java-spark-data-analyzer.git
+cd java-spark-data-analyzer
+```
+
+2. Compile o projeto:
+```bash
+mvn clean package
+```
+
+## ▶️ Execução
+
+### Usando Maven
+
+```bash
+# Para Java 8/11
+mvn exec:java -Dexec.mainClass="com.dataanalyzer.DataAnalyzer"
+
+# Para Java 17+
+mvn exec:java -Dexec.mainClass="com.dataanalyzer.DataAnalyzer" -Dexec.args="" \
+-Dexec.cleanupDaemonThreads=false \
+-Dexec.jvmArgs="--add-opens=java.base/java.nio=ALL-UNNAMED \
+--add-opens=java.base/sun.nio.ch=ALL-UNNAMED \
+--add-opens=java.base/java.util=ALL-UNNAMED \
+--add-opens=java.base/java.lang.invoke=ALL-UNNAMED \
+--add-opens=java.base/java.util.concurrent=ALL-UNNAMED"
+```
+
+### Usando o JAR compilado
+
+```bash
+# Para Java 8/11
+java -jar target/java-spark-data-analyzer-1.0-SNAPSHOT-jar-with-dependencies.jar
+
+# Para Java 17+
+java --add-opens=java.base/java.nio=ALL-UNNAMED \
+--add-opens=java.base/sun.nio.ch=ALL-UNNAMED \
+--add-opens=java.base/java.util=ALL-UNNAMED \
+--add-opens=java.base/java.lang.invoke=ALL-UNNAMED \
+--add-opens=java.base/java.util.concurrent=ALL-UNNAMED \
+-jar target/java-spark-data-analyzer-1.0-SNAPSHOT-jar-with-dependencies.jar
+```
+
+## 📁 Estrutura do Projeto
+
+```
+java-spark-data-analyzer/
+├── src/
+│   └── main/
+│       ├── java/
+│       │   └── com/
+│       │       └── dataanalyzer/
+│       │           └── DataAnalyzer.java
+│       └── resources/
+│           └── dados_vendas.csv
+├── pom.xml
+└── README.md
+```
+
+## ❓ Solução de Problemas
+
+### Windows e Hadoop
+
+O Spark usa algumas funcionalidades do Hadoop que podem gerar avisos no Windows. Se encontrar avisos relacionados ao `winutils.exe` ou `HADOOP_HOME`, você pode:
+
+1. Ignorá-los (não afetam a funcionalidade básica do aplicativo)
+2. Configurar o ambiente Hadoop para Windows:
+    - Baixe o [winutils.exe](https://github.com/cdarlint/winutils)
+    - Crie uma pasta `C:\hadoop\bin` e coloque o arquivo lá
+    - Configure a variável de ambiente `HADOOP_HOME=C:\hadoop`
+    - Adicione `%HADOOP_HOME%\bin` ao PATH
+
+### Aviso de "illegal reflective access"
+
+Este aviso pode aparecer ao usar Java 11. É normal e não afeta o funcionamento do aplicativo.
+
+## 📊 Dados de Exemplo
+
+O projeto inclui um arquivo de exemplo `dados_vendas.csv` com dados fictícios de vendas de produtos eletrônicos para testar as funcionalidades do aplicativo. Este arquivo contém os seguintes campos:
+
+| Campo | Descrição |
+|-------|-----------|
+| ID | Identificador único da venda |
+| Data | Data da venda (formato YYYY-MM-DD) |
+| Produto | Nome do produto vendido |
+| Categoria | Categoria do produto |
+| Preco | Preço unitário do produto |
+| Quantidade | Quantidade vendida |
+| ClienteID | Identificador do cliente |
+| Regiao | Região geográfica da venda |
+| Vendedor | Nome do vendedor |
+| Desconto | Percentual de desconto aplicado (decimal) |
+
+## 📝 Uso Básico
+
+Ao iniciar o aplicativo, você verá um menu interativo:
+
+1. **Carregue os dados** usando a opção 1
+    - Digite o caminho para o CSV ou use "example" para o arquivo de exemplo
+    - Confirme se o arquivo tem cabeçalho (s/n)
+    - Especifique o delimitador (geralmente vírgula)
+
+2. **Explore os dados**:
+    - Opção 2: Ver a estrutura (schema) dos dados
+    - Opção 3: Ver uma amostra dos dados
+    - Opção 4: Ver estatísticas descritivas
+
+3. **Analise e transforme os dados**:
+    - Opção 5: Filtrar registros
+    - Opção 6: Agregar dados (ex: soma de vendas por região)
+    - Opção 7: Transformar dados (criar colunas, renomear, etc.)
+
+4. **Salve os resultados** usando a opção 8
+
+## 🤝 Contribuições
+
+Contribuições são bem-vindas! Se você encontrar bugs ou tiver sugestões de melhorias, abra uma issue ou envie um pull request.
+
+## 📜 Licença
+
+Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para detalhes.
+
+---
+
+<div align="center">
+  <p><strong>Por que Java para análise de dados?</strong> Desempenho superior, tipagem estática, multithreading robusto e integração perfeita com sistemas empresariais.</p>
+  <p><em>Java Spark Data Analyzer - A resposta Java para a análise de dados em Python.</em></p>
+</div>
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+# Project exclude paths`
	`2`	`+/target/`