本日、私たちはDream Commons Aggregatesを発表します。これは、The Dream Dropから派生した月次の非識別化データセットです。各リリースは引用可能で、バージョン管理されており、再現可能な研究、教育、探索的分析のために設計されています。
概念 DOI (常に最新)
2025年9月リリース (バージョン DOI)
各月次リリースの内容
- 高レベルのカウント(サンプルサイズ、エンゲージメント)。
- ドメインごとの特徴別分布(例:タイプ、ムード、テーマ、キャラクター、視点、時間、影響、明晰さ、繰り返し)。
- 月ごとのデルタ(パーセンテージポイント)。
- ストップワードフィルタリングされた用語頻度(CJK対応)。
- ドキュメント:SCHEMA.md、QUALITY_REPORT.csv、MANIFEST.json、CHANGES.md、CITATION.txt、LICENSE.txt、DATA_USE.txt。
- 便利さ:JSON/Parquetミラー、再現ノートブック、および最大のポジティブ/ネガティブ動向のプレーンテキストパルスサマリー。
すべてUTF-8で、コアアーティファクトのチェックサムが含まれており、整合性の検証と再現可能なワークフローをサポートします。
なぜこれを行うのか
このシリーズは私たちのCollective Dream Model (CDM)を実践に移します:The Dream Drop内の個々のログが成長するオープン知識ベースに寄与します。標準化された月次集計をリリースすることで、私たちは:
- 独立した検証と二次分析の障壁を下げ、
- クリーンでバージョン管理されたデータを用いて教育と手法開発を支援し、
- 時間の経過に伴う公的記録を保持します。
使用方法と引用
- ライセンス: CC BY-NC 4.0(非商業)。
- 帰属: “Root Code Collective — Dream Commons(毎月の集計リリース)”。
- 引用: 分析する月のバージョン DOIを使用してください。一般的な指針については、引用ガイドラインをご覧ください。
クイックリンク:
- 概念 DOI(常に最新): https://doi.org/10.5281/zenodo.17297159
- 2025年9月データセット: https://doi.org/10.5281/zenodo.17297160
プライバシーと倫理
リリースには非識別化された集計のみが含まれており、個人情報、生データ、または行レベルのデータは含まれていません。以下を遵守してください:
- 小グループを露呈する可能性のある詳細な内訳を避けること、
- 再識別の試みを控えること、
- 適切な注意書きと共に結果を報告すること。
完全なポリシーについてはDATA_USE.txtをご覧ください。
月次パルス
各リリースには、前月に対するドメイン別の最大のポジティブおよびネガティブ動向を示す短いパルスサマリーが含まれています。読者が見る形式は以下の通りです:
タイプ +4.9% 標準 -3.9% ポジティブ
ムード +3.1% 敗北 -3.2% 驚き
…(完全なサマリーはpulse_movements_YYYY-MM.txtにあります)
研究者と教育者のために
- 再現性: ノートブック (
notebooks/replicate_pulse_YYYY-MM.ipynb) は迅速なチェック、ビジュアル、パルス抽出を示します。 - 相互運用性: CSV + JSON + Parquet、明確なスキーマとコードブック付き。
- 出所: 監査可能性のためにビルドハッシュとチェックサムが含まれています。
異なる形式や教育用の小さな便利なエクスポートが必要な場合は、メールでご連絡ください:contact@rootcodecollective.org。
ロードマップ
- パイプラインのエンドツーエンドを説明する軽量で人間が読めるメソッドプレプリント。
- シリーズが成熟するにつれて追加の派生テーブル(例:長期的なデルタ)。
- コミュニティの例と教育用ノートブック。
データを取得する
- 最新のデータセット(概念 DOI):https://doi.org/10.5281/zenodo.17297159
- 2025年9月(バージョン DOI):https://doi.org/10.5281/zenodo.17297160
倫理的でオープンアクセスの夢の研究を支援していただきありがとうございます。データ、論文、ビジュアライゼーション、教育モジュールを使って何かを構築した場合は、お知らせください!私たちはそれを特集したいと思っています。