Skip to content

OptonGroup/T1_hackathon

Repository files navigation

voyager_logo

Voyager: Сервис для определения "Золотой записи"🌟

Voyager — это масштабируемое и эффективное решение, предназначенное для поиска "золотой записи" в больших наборах данных. Сервис оценивает данные на основе актуальности, частоты и полноты, помогая устранить дубликаты и улучшить качество данных. 📊

Наш проект вдохновлен легендарной миссией NASA 🚀, в рамках которой космические аппараты "Вояджер" отправились в межзвездное пространство, неся на борту золотые диски. Эти диски содержат звуки и изображения, представляющие разнообразие жизни и культуры на Земле, и служат посланием для возможных внеземных цивилизаций. 👽 Подобно тому, как золотые диски "Вояджера" содержат ценную информацию, наш проект направлен на извлечение и идентификацию наиболее значимых и ценных данных из массивных наборов информации. 💾


Проблематика

Большие наборы данных часто содержат:

  • Дублирующиеся записи. 🔄
  • Некорректные или неполные данные. ❌
  • Опечатки и нереалистичные значения. 🧐

Это затрудняет анализ и принятие решений. Voyager позволяет консолидировать такие данные в одну, наиболее точную "золотую запись" для каждой сущности, улучшая их качество и упрощая дальнейшую обработку. 📈


Основные возможности

  • Определение "золотой записи": Находит наиболее полную, актуальную и достоверную запись. 🏆
  • Высокая масштабируемость: Обрабатывает миллионы записей с десятками полей. 📚
  • Обеспечение качества данных: Повышает надежность данных для анализа и операций. 🔍

Преимущества

  1. Точность и полнота:
    • Высокая точность при выборе "золотых записей". 🎯
    • Сохранение полных и достоверных значений полей. ✅
  2. Надежность:
    • Минимизация ошибок и стабильность результатов. 🔒
  3. Масштабируемость:
    • Эффективная работа с большими объемами данных и возможность адаптации к другим наборам. 📈
  4. Зависимости:
    • Используются только стандартные и открытые библиотеки, доступные для коммерческого использования. 📚
    • Отсутствие внешних или проприетарных сервисов. 🚫

Как запустить проект

Запустить через командную строку

pip install -r requirements.txt
python server.py

1. Требования

  • Python версии 3.10 или выше. 🐍 (тестировали на 3.10 и 3.12)
  • Библиотеки: pandas, annotated-types, anyio, click colorama, fastapi, h11, idna, Jinja2, MarkupSafe, numpy, patool, pydantic, pydantic_core, python-dateutil, python-multipart, pytz, six, sniffio, starlette, typing_extensions, tzdata, uvicorn

2. Установка и запуск

Python

git clone https://github.com/OptonGroup/T1_hackathon.git
cd voyager
pip install -r requirements.txt
python server.py
http://127.0.0.1:8000/   

Docker

Инструкции по установке Docker (не могут скачаться большие файлы)

Чтобы запустить это приложение с помощью Docker, выполните следующие действия:

  1. Создайте и запустите контейнер:
docker-compose up --build
  1. Приложение будет доступно по адресу http://localhost:5000

  2. Чтобы остановить приложение:

docker-compose down

Примечание: Приложение настроено на:

  • Запуск на порту 5000
  • Автоматический перезапуск в случае сбоя
  • Используйте монтирование тома, чтобы отразить изменения в коде без перестройки
  • Включите все необходимые зависимости Python

Скриншоты продукта

Без имени-2

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •