Работа с датасетами¶
Датасеты в Р13.Орбита - это сохраненные результаты запросов, которые можно переиспользовать для дальнейшего анализа и визуализации. Это мощный инструмент для организации работы с данными.
Что такое датасет¶
Датасет - это именованный снимок данных, полученных в результате выполнения запроса. После сохранения вы можете:
- Быстро открыть данные без повторного запроса к БД
- Создавать визуализации на основе сохраненных данных
- Делиться результатами с коллегами
- Сравнивать данные за разные периоды
Пример
Вы выполнили запрос "покажи топ-20 товаров по продажам за февраль". Результат можно сохранить как датасет топ_февраль и потом быстро открывать или строить по нему графики.
Зачем нужны датасеты¶
1. Экономия времени¶
Вместо повторного выполнения сложного запроса просто откройте сохраненный датасет.
Без датасета:
> покажи топ-20 товаров по продажам с детализацией по категориям и брендам за февраль с учетом скидок
[Ждем 5-10 секунд]
С датасетом:
2. Организация работы¶
Группируйте связанные данные по проектам или задачам:
3. Сравнение периодов¶
Сохраните данные за разные периоды и сравнивайте:
4. Визуализация¶
Создавайте графики на основе готовых данных:
Как сохранить датасет¶
Способ 1: В запросе (рекомендуется)¶
Добавьте инструкцию сохранения прямо в запрос:
Система: 1. Выполнит запрос 2. Покажет результат 3. Сохранит данные под именем топ_февраль
Способ 2: После выполнения запроса¶
Если забыли сохранить, используйте команду:
> покажи продажи по категориям за квартал
[Результаты...]
> сохрани последний результат как продажи_q1
Правила именования¶
Рекомендации:
- Используйте понятные описательные имена
- Включайте период времени если релевантно
- Используйте подчеркивания вместо пробелов
- Избегайте специальных символов
Как просмотреть список датасетов¶
Команда /datasets¶
Выведет список всех сохраненных датасетов:
Сохраненные датасеты:
1. топ_февраль
Создан: 2024-03-15 14:30
Строк: 20
Описание: топ-20 товаров по продажам за февраль
2. клиенты_москва
Создан: 2024-03-14 10:15
Строк: 1247
Описание: клиенты из Москвы
3. продажи_q1
Создан: 2024-03-10 16:45
Строк: 150
Описание: продажи по категориям за квартал
В запросе¶
Как открыть датасет¶
Способ 1: Командой¶
Способ 2: В запросе¶
Р13.Орбита загрузит данные и покажет их в виде таблицы:
Датасет: топ_февраль
Создан: 2024-03-15 14:30
Строк: 20
┌────────────────────────┬──────────────┐
│ Товар │ Продажи (₽) │
├────────────────────────┼──────────────┤
│ Смартфон Galaxy S23 │ 15 234 500 │
│ Ноутбук MacBook Pro │ 12 890 300 │
│ ... │ ... │
└────────────────────────┴──────────────┘
Как удалить датасет¶
Внимание
Удаление датасета необратимо. Убедитесь, что данные вам больше не нужны.
Использование датасетов для визуализации¶
Один из самых мощных сценариев - создание графиков на основе датасетов.
Быстрый способ¶
С уточнением типа¶
> построй линейный график по датасету динамика_продаж
> построй столбчатую диаграмму по датасету топ_категорий
> построй круговую диаграмму по датасету доля_по_городам
Типичные сценарии использования¶
Сценарий 1: Ежемесячный анализ¶
Задача: Каждый месяц анализировать топ товаров.
Решение:
# Январь
> покажи топ-20 товаров по продажам за январь и сохрани как топ_январь
# Февраль
> покажи топ-20 товаров по продажам за февраль и сохрани как топ_февраль
# Сравнение
> открой датасет топ_январь
> открой датасет топ_февраль
Сценарий 2: Подготовка отчета¶
Задача: Собрать данные для отчета руководству.
Решение:
# Соберите данные
> покажи общую выручку по категориям за квартал и сохрани как выручка_q1
> покажи топ-10 клиентов по сумме заказов и сохрани как топ_клиенты_q1
> покажи динамику продаж по месяцам и сохрани как динамика_q1
# Создайте визуализации
> построй график по датасету динамика_q1
> построй диаграмму по датасету выручка_q1
# Теперь у вас есть все данные и графики для отчета
Сценарий 3: Анализ проблем¶
Задача: Разобраться с отмененными заказами.
Решение:
# Сохраните проблемные данные
> покажи заказы со статусом Отменен за последний месяц и сохрани как отмены_март
# Анализируйте
> открой датасет отмены_март
> покажи количество отмен по причинам
> покажи в каких городах больше всего отмен
Сценарий 4: Работа с большими данными¶
Задача: Нужно несколько раз обращаться к большому набору данных.
Решение:
# Один раз выполните тяжелый запрос и сохраните
> покажи все заказы с детализацией за 2024 год и сохрани как заказы_2024
# Теперь работайте с датасетом
> открой датасет заказы_2024
> построй график динамики по месяцам
> покажи статистику по статусам
Метаданные датасетов¶
Каждый датасет содержит метаинформацию:
- Название - имя датасета
- Дата создания - когда был сохранен
- Количество строк - объем данных
- Описание - оригинальный запрос
- Автор - кто создал (в мультипользовательском режиме)
- Схема - структура полей и типов данных
Просмотр метаданных:
Ограничения датасетов¶
Важно знать
- Размер: Датасеты ограничены 10 000 строк по умолчанию
- Актуальность: Данные сохраняются на момент создания датасета
- Хранение: Датасеты хранятся в метаданных БД
- Доступ: В локальном режиме - только ваши датасеты
Обновление датасета¶
Датасеты не обновляются автоматически. Чтобы получить свежие данные:
# Удалите старый
> удали датасет топ_февраль
# Создайте новый с тем же именем
> покажи топ-20 товаров по продажам за февраль и сохрани как топ_февраль
Экспорт датасетов¶
Хотите сохранить данные локально?
# Экспорт в CSV
> экспортируй датасет топ_февраль в CSV
# Экспорт в Excel
> экспортируй датасет топ_февраль в Excel
# Экспорт в JSON
> экспортируй датасет топ_февраль в JSON
Файл будет сохранен в директорию ~/orbita/exports/.
Советы по работе с датасетами¶
Совет 1: Называйте датасеты осмысленно
Через месяц вы забудете, что такое dataset1. Используйте описательные имена.
Совет 2: Удаляйте неактуальные датасеты
Регулярно чистите список датасетов, удаляя устаревшие данные.
Совет 3: Группируйте по проектам
Используйте префиксы:
Совет 4: Сохраняйте промежуточные результаты
При сложном анализе сохраняйте промежуточные шаги как датасеты.
Совет 5: Документируйте
В описании датасета укажите контекст:
Команды для работы с датасетами¶
| Команда | Описание | Пример |
|---|---|---|
сохрани как [имя] | Сохранить результат запроса | ... и сохрани как мой_датасет |
/datasets | Список всех датасетов | /datasets |
открой датасет [имя] | Открыть датасет | открой датасет топ_февраль |
/load [имя] | Загрузить датасет | /load топ_февраль |
удали датасет [имя] | Удалить датасет | удали датасет старые_данные |
/delete [имя] | Удалить датасет | /delete старые_данные |
информация о датасете [имя] | Метаданные датасета | информация о датасете топ_февраль |
экспортируй датасет [имя] | Экспорт в файл | экспортируй датасет топ_февраль в CSV |
Следующие шаги¶
Теперь вы умеете работать с датасетами! Переходите к:
- Создание визуализаций - превратите датасеты в графики
- Примеры использования - изучите практические сценарии
- Советы и хитрости - продвинутые техники
Эффективной работы с данными! 💾