AI News Aggregation and Analysis System

Overview

This project is a sophisticated multi-agent system designed to automate the process of gathering, analyzing, and summarizing news articles from various sources. The system employs three specialized agents working in concert to deliver comprehensive news analysis and reporting.

Core Components

1. EnhancedDataAcquisitionAgent

Fetches articles from configured news sources and RSS feeds
Handles both web scraping and RSS feed parsing
Implements intelligent rate limiting and error handling
Stores raw article data for processing

2. EnhancedContentAnalysisAgent

Processes raw articles using natural language processing (NLP)
Leverages OpenAI's GPT-3.5 Turbo for advanced summarization
Extracts key topics and themes
Generates concise article summaries
Performs keyword analysis and categorization

3. EnhancedReportingAgent

Generates structured reports from analyzed content
Maintains article archives
Separates new and previously processed articles
Creates organized summaries for easy consumption

Technical Requirements

Dependencies

nltk==3.8.1
openai==1.3.0
loguru==0.7.2
python-dotenv==1.0.0
requests==2.31.0
beautifulsoup4==4.12.2
feedparser==6.0.10

System Requirements

Python 3.8+
SQLite3
2GB+ RAM recommended
Internet connection for API access

Installation

Clone the repository:

git clone https://github.com/yourusername/your-repo-name.git
cd your-repo-name

Set up virtual environment:

python -m venv venv
source venv/bin/activate  # On Windows use `venv\Scripts\activate`

Install dependencies:
```
pip install -r requirements.txt
```
Environment Configuration: Create a .env file in the root directory with the following:
```
OPENAI_API_KEY=your_openai_api_key
```

Configuration

The system is highly configurable through the utils/config.py file:

News Sources

Configurable list of news sources and RSS feeds
Support for both web scraping and RSS parsing
Custom keyword-based RSS feeds

Processing Parameters

Adjustable summary length
Configurable number of keywords per article
Customizable update intervals
Flexible retry mechanisms

Output Settings

Configurable report directory
Multiple output formats
Customizable logging levels

Usage

Start the system:
```
python main.py
```
Monitor Progress: The system creates three log files:
- data_acquisition.log: Tracks article fetching
- content_analysis.log: Monitors processing
- reporting.log: Records report generation

Data Flow

Acquisition Phase
- Fetches articles from configured sources
- Validates and deduplicates content
- Stores raw data in SQLite database
Analysis Phase
- Processes raw content using NLP
- Generates summaries using OpenAI
- Extracts keywords and themes
- Categorizes content
Reporting Phase
- Generates structured reports
- Archives processed articles
- Creates searchable indexes

File Structure

project/
├── agents/
│   ├── __init__.py
│   ├── data_acquisition_agent.py
│   ├── content_analysis_agent.py
│   └── reporting_agent.py
├── utils/
│   ├── __init__.py
│   └── config.py
├── data/
│   └── articles.db
├── reports/
├── .env
├── main.py
└── requirements.txt

Logging

The system implements comprehensive logging using Loguru:

Rotation-based log files
Configurable log levels
Detailed error tracking
Performance metrics

Error Handling

Robust retry mechanisms for failed requests
Graceful degradation for API limits
Comprehensive error logging
Data validation at each step

Contributing

Fork the repository
Create a feature branch
Commit changes
Push to the branch
Create a Pull Request

License

MIT License - See LICENSE file for details

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.idea		.idea
agents		agents
database		database
nltk_data		nltk_data
reports		reports
utils		utils
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
all_articles.json		all_articles.json
blockchain_intel.db		blockchain_intel.db
blockchain_intel.log		blockchain_intel.log
content_analysis.log		content_analysis.log
data.json		data.json
data_acquisition.log		data_acquisition.log
download_nltk_data.py		download_nltk_data.py
file_1.log		file_1.log
main.py		main.py
reporting.log		reporting.log
scraped_articles.json		scraped_articles.json
summarized_articles.json		summarized_articles.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI News Aggregation and Analysis System

Overview

Core Components

1. EnhancedDataAcquisitionAgent

2. EnhancedContentAnalysisAgent

3. EnhancedReportingAgent

Technical Requirements

Dependencies

System Requirements

Installation

Configuration

News Sources

Processing Parameters

Output Settings

Usage

Data Flow

File Structure

Logging

Error Handling

Contributing

License

About

Releases

Packages

Languages

ssbaraar/News_Summary_Agent

Folders and files

Latest commit

History

Repository files navigation

AI News Aggregation and Analysis System

Overview

Core Components

1. EnhancedDataAcquisitionAgent

2. EnhancedContentAnalysisAgent

3. EnhancedReportingAgent

Technical Requirements

Dependencies

System Requirements

Installation

Configuration

News Sources

Processing Parameters

Output Settings

Usage

Data Flow

File Structure

Logging

Error Handling

Contributing

License

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages