-
Notifications
You must be signed in to change notification settings - Fork 546
Bug: Cannot fetch content from Facebook posts #697
Copy link
Copy link
Open
Labels
bugSomething isn't workingSomething isn't workingenhancementNew feature or requestNew feature or request
Description
🐛 Bug Description
GoClaw không thể fetch nội dung từ Facebook posts. Khi người dùng gửi link Facebook bot, hệ thống không trích xuất được content từ các URL dạng:
https://www.facebook.com/share/p/{post_id}/https://www.facebook.com/{username}/posts/{post_id}/
🔍 Expected Behavior
Bot có thể:
- Fetch và trích xuất nội dung text từ Facebook posts
- Xử lý các loại URL Facebook khác nhau (share links, direct post links)
- Handle authentication/paywall cases gracefully (nếu có)
📝 Example
URL test: https://www.facebook.com/share/p/1CNZhmWeQh/?mibextid=wwXIfr
Kết quả hiện tại: Không fetch được content
🎯 Possible Solutions
- Web scraper/Fetcher enhancement — Cập nhật logic fetch để handle Facebook HTML structure
- Facebook Graph API — Tích hợp official API (cần access token)
- Third-party scraper — Dùng service như Apify, ScrapingBee (nếu cần)
- Graceful fallback — Nếu không fetch được, inform user và skip content extraction
📋 Technical Notes
- Facebook có anti-scraping mechanisms (login wall, rate limiting)
- Cần test với cả public posts và posts yêu cầu login
- Consider using
web_fetchtool với appropriate extractMode
🔗 Related
- Feature: Link preview/content extraction in GoClaw
- Affects: User experience when sharing Facebook content
Reported by: @voquoccuong
Priority: MEDIUM (UX enhancement)
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
bugSomething isn't workingSomething isn't workingenhancementNew feature or requestNew feature or request