Агрегаты Dream Commons: Ежемесячные открытые данные для исследований снов

Агрегаты Dream Commons: Ежемесячные открытые данные для исследований снов

Сегодня мы запускаем Dream Commons Aggregates, ежемесячный, анонимизированный набор данных, полученный из The Dream Drop. Каждый выпуск является цитируемым, версионированным и предназначен для воспроизводимых исследований, обучения и исследовательского анализа.

DOI концепции (всегда актуальный)
Выпуск сентября 2025 года (DOI версии)


Что содержится в каждом ежемесячном выпуске

  • Общие показатели (размер выборки, вовлеченность).
  • Распределения по признакам в разных областях (например, Тип, Настроение, Тема, Персонажи, Перспектива, Время, Влияние, Ясность, Повторяющиеся).
  • Месячные дельты в процентных пунктах.
  • Частотности терминов с фильтрацией стоп-слов (учитывающие CJK).
  • Документация: SCHEMA.md, QUALITY_REPORT.csv, MANIFEST.json, CHANGES.md, CITATION.txt, LICENSE.txt, DATA_USE.txt.
  • Удобство: зеркала JSON/Parquet, ноутбук для воспроизведения и резюме в простом тексте о самых крупных положительных/отрицательных изменениях.

Все данные в кодировке UTF-8, с контрольными суммами для основных артефактов для поддержки проверки целостности и воспроизводимых рабочих процессов.


Почему мы это делаем

Эта серия реализует нашу Collective Dream Model (CDM) на практике: индивидуальные журналы в The Dream Drop способствуют растущей, открытой базе знаний. Выпуская стандартизированные ежемесячные агрегаты, мы:

  • снижаем барьер для независимой валидации и вторичного анализа,
  • поддерживаем обучение и разработку методов с помощью чистых, версионированных данных,
  • сохраняем публичный отчет о изменениях с течением времени.

Как использовать и цитировать

  • Лицензия: CC BY-NC 4.0 (некоммерческая).
  • Атрибуция: “Root Code Collective — Dream Commons (ежемесячный агрегатный выпуск)”.
  • Цитирование: Используйте DOI версии за месяц, который вы анализируете. Для общих рекомендаций смотрите наши Руководство по цитированию.

Быстрые ссылки:


Конфиденциальность и этика

Выпуски содержат только анонимизированные агрегаты, без личных, сырых или построчных данных. Пожалуйста:

  • избегайте детализированных разбивок, которые могут раскрыть небольшие группы,
  • воздержитесь от любых попыток повторной идентификации,
  • сообщайте результаты с соответствующими оговорками.

Смотрите DATA_USE.txt для полной политики.


Ежемесячный обзор

Каждый выпуск включает короткое резюме обзора, самые крупные положительные и отрицательные изменения по областям (по сравнению с предыдущим месяцем). Вот формат, который увидят читатели:

Тип +4.9% стандарт -3.9% положительный

Настроение +3.1% побежденный -3.2% удивление

… (полное резюме в pulse_movements_YYYY-MM.txt)


Для исследователей и преподавателей

  • Воспроизводимость: Ноутбук (notebooks/replicate_pulse_YYYY-MM.ipynb) демонстрирует быстрые проверки, визуализации и извлечение обзора.
  • Совместимость: CSV + JSON + Parquet с четкой схемой и кодовой книгой.
  • Происхождение: Включены хеши и контрольные суммы для аудита.

Если вам нужен другой формат или небольшой экспорт для обучения, напишите нам: contact@rootcodecollective.org.


Дорожная карта

  • Легкий, читаемый человеком предпечатный метод, описывающий весь процесс от начала до конца.
  • Дополнительные производные таблицы (например, дельты на более длительный срок) по мере развития серии.
  • Примеры сообщества и учебные ноутбуки.

Получите данные

Спасибо за поддержку этических, открытых исследований о мечтах. Если вы создадите что-то с данными, статьей, визуализацией, учебным модулем, дайте нам знать! Мы будем рады это представить.