Memory and Context

Agents have a 3-tier memory system: working memory (current), summaries (history), and archives (long-term).

Memory Tiers

Working Memory

Current conversation buffer. Keeps recent messages in context.

Default: 8,000 tokens
Contains: Last N messages
Cost: Included in each request

Summary Memory

When working memory fills, creates summary of key points.

Default: 5 messages
Triggered when: 5+ messages in working
Contains: Condensed history

Configuration

Adjust Working Memory

Smaller (4,000 tokens):

Pros: Lower cost, faster responses
Cons: Forgets details quickly

Larger (16,000 tokens):

Pros: Better context, fewer summaries
Cons: Higher cost, slower

Default (8,000 tokens):

Good balance for most uses

Change:

Agents > Select agent
Settings > Memory
Set working_memory_size
Click Save

Summary Threshold

When working memory reaches N messages, create summary.

Lower (3): Summarize more often (cheaper)
Higher (10): Summarize less often (better context)
Default (5): Good balance

Change:

Settings > Memory
Set summary_message_threshold
Click Save

Memory Management

View Memory Usage

Agents > Select agent
Analytics tab
See memory tokens used

Clear Memory

Open conversation
Click Clear History
Confirm

Conversation history deleted. Cost savings.

Export Memory

Open conversation
Click Export
Download as JSON/PDF

Best Practices

Balance Cost and Quality

Use Case	Working Memory	Summary
Quick Q&A	4,000	10
Research	12,000	5
Support	8,000	5
Code	16,000	3

Monitor Memory Growth

Check usage dashboard:

How much memory used per conversation?
Trending up or stable?
Adjust if needed

Archive Old Conversations

Periodically clear old conversations to reduce costs.

Memory Limitations

Working memory is conversation-scoped (not shared between agents)
Summaries are automatic (can’t manually create)
Archives are read-only (can’t modify)
Memory persists even after agent updates

Troubleshooting

Agent forgets context

Increase working_memory_size
Increase summary_threshold
Ask user to provide context again

Memory costs too high

Reduce working_memory_size
Lower summary_threshold (summarize more)
Clear old conversations

Incorrect summaries

Summaries are LLM-generated (won’t be perfect)
Verify important details in conversation
Consider manually archiving if critical

​Memory Tiers

​Working Memory

​Summary Memory

​Archive

​Configuration

​Adjust Working Memory

​Summary Threshold

​Memory Management

​View Memory Usage

​Clear Memory

​Export Memory

​Best Practices

​Balance Cost and Quality

​Monitor Memory Growth

​Archive Old Conversations

​Memory Limitations

​Troubleshooting

​Agent forgets context

​Memory costs too high

​Incorrect summaries

​Next Steps