Údaje
Podmínky pro opětovné použití
Databáze Open Food Facts je k dispozici pod Open Database License.
Jednotlivý obsah databáze je k dispozici pod licencí k obsahu databáze.
Obrázky produktů jsou k dispozici pod licencí Creative Commons Uveďte autora ShareAlike.
Mohou obsahovat grafické prvky podléhající autorským právům nebo jiným právům, které mohou být v některých případech reprodukovány (práva na nabídky nebo fair use).
Před opětovným použitím dat si prosím přečtěte Podmínky používání a opětovného použití.
Řekněte nám o svém opětovném použití
Velmi nás zajímá zjištění, k čemu se používají data Open Food Facts. To není povinné, ale velmi bychom ocenili, kdybyste nám řekli o svém opětovném použití, abychom ho mohli sdílet s komunitou Open Food Facts. Můžete také vyplnit tento formulář a získat tak šanci, aby byla vaše aplikace doporučena.
Export dat Open Food Facts
Výpisy a exporty databáze se generují každou noc. Databáze je velmi velká, takže můžete najít různé způsoby, jak použít datav závislosti na variantě exportu.
Informace o různých polích pro výpis MongoDB a exporty CSV jsou k dispozici na adrese https://world.openfoodfacts.org/data/data-fields.txt
Výpis MongoDB
Data pro všechny produkty jsou k dispozici ve výpisu databáze MongoDB.
- Odkaz
- https://static.openfoodfacts.org/data/openfoodfacts-mongodbdump.gz
- sha256sum
- https://static.openfoodfacts.org/data/gz-sha256sum
- md5sum
- https://static.openfoodfacts.org/data/gz-md5sum
Delta Export
Denní delta exporty jsou poskytovány za předchozích 14 dní. Seznam aktuálně dostupných delta souborů lze nalézt na https://static.openfoodfacts.org/data/delta/index.txt.
Každý řádek představuje soubor, který je dostupný na adrese https://static.openfoodfacts.org/data/delta/{filename}.
Název souboru obsahuje UNIX časové razítko prvního a poslední změny obsažené v souboru JSON, aby delta soubory mohly být importovány (po extrakci) pomocí mongoimport v abecedním pořadí.
Vezměte prosím na vědomí, že vzhledem k povaze mongoexportvám delta soubory nemohou říci o smazaných produktech. Chcete-li odebrat odstraněné produkty z databáze, musíte importovat celý výpis MongoDB.
Export dat JSONL
Celá databáze je k dispozici také ve formátu JSONL (někdy nazývaném LDJSON nebo NDJSON), kde je každý řádek objektem JSON. Představuje stejná data jako export MongoDB. Soubor je komprimován pomocí gzip.
Vhodným způsobem využití databáze je použití DuckDB, analytický nástroj v průběhu procesu určený ke zpracování velkého množství údajů v zlomku sekund. Můžete si přečíst náš příspěvek na blogu, kde vás provázíme průzkumem a zpracováním databáze Open Food Facts s DuckDB
Export dat CSV
Zjednodušená verze výpisu JSONL je k dispozici také ve formátu Parquet. Při převodu jsme filtrovali sloupce, které obsahují duplicitní informace, slouží k internímu ladění nebo jsou pro uživatele jednoduše irelevantní.
Ukázalo se, že formát Parquet je vhodný:
- Data jsou organizována podle sloupců, nikoli podle řádků, což šetří úložný prostor a urychluje analytické dotazy, tj. můžete vybrat pouze sloupce, které vás zajímají, a optimalizovat tak výkon dotazů, a to i na méně výkonných počítačích.
- Vysoce účinná komprese a dekomprese dat, díky čemuž je vhodná pro ukládání a sdílení velkých datových sad jakéhokoli druhu,
- Podporuje komplexní datové typy a pokročilé vnořené datové struktury.
Soubor dat je k dispozici na Hugging Face, kolaborativním ekosystému strojového učení, kde mohou vývojáři a výzkumníci sdílet modely a datové sady.
Další informace najdete na Wiki, včetně pokynů pro opětovné použití dat a příkladů dotazů, jak začít.Export dat RDF
Data pro všechny produkty nebo některé produkty lze stáhnout ve formátu CSV (čitelný pomocí LibreOffice, Excel a mnoha dalších tabulkových softwarů) prostřednictvím formuláře pro pokročilé vyhledávání.
- Odkaz
- Jídlo: https://static.openfoodfacts.org/data/en.openfoodfacts.org.products.csv.gz (komprimovaný CSV ve formátu GZIP: ~ 0,9 Gb, nekomprimovaný: ~ 9 Gb)
- Kosmetika: https://static.openbeautyfacts.org/data/en.openbeautyfacts.org.products.csv.gz
- Krmivo pro domácí mazlíčky: https://static.openpetfoodfacts.org/data/en.openpetfoodfacts.org.products.csv.gz
- Všechny ostatní produkty: https://static.openproductsfacts.org/data/en.openproductsfacts.org.products.csv.gz
Kódování souboru je Unicode UTF-8. Znak, který odděluje pole, je <tab> (tabulka).
Export obrazových dat
Databáze je k dispozici také ve formátu RDF (jedná se o experiment, který již není aktivně udržován). Můžete si přečíst oznámení ve francouzštině.
Hledáme pomoc s OpenAPI
Všechny obrázky a výsledky OCR lze stáhnout z našeho serveru nebo z AWS (prostřednictvím AWS Open Data Program). Pro více informací o stahování obrázků se podívejte do naší dokumentace
Dokumentace OpenAPI pro JSON API
K dispozici je také JSON API pro čtení dat pro produkt. Toto API se používá zejména v mobilní aplikaci Open Food Facts.
API v průběhu času vylepšujeme, ale dbáme na zachování zpětné kompatibility. Prosím, kontaktujte nás, pokud ho používáte, abychom Vás mohli informovat o možných změnách.
Objevte naše APIPřispívání k vylepšení našeho API a dokumentace k OpenAPI
Těšíme se na dokončení dokumentace k API, přidání případů užití a automatizaci generování SDK. Pokud jste znalci OpenAPI, rádi si necháme pomoct.
API můžete používat i v produkčních aplikacích, pokud 1 volání API = 1 skutečné skenování uživatelem. Jakýkoli pokus o scraping databáze pomocí API bude s největší pravděpodobností zablokován, protože kompletní denní exporty jsou k dispozici na této stránce.
Také odeslání HTTP hlavičky s voláním API je dobrý způsob, jak se s vámi můžeme spojit, pokud by nastal jakýkoli problém.
XML API (nepodporováno)
Kódy pro oficiální mobilní aplikace Open Food Facts jsou dostupné na GitHubu: Flutter, Kotlin Android a Swift iOS
Uvažujeme o přeměně zastaralých kódových základen Kotlinu a Swiftu na SDK Kotlinu a Swiftu, pomoc vítána :-)
Toto API není aktivně udržováno a není oficiálně zdokumentováno.Obaly a sady SDK
Pravděpodobně máme wrapper pro váš oblíbený programovací jazyk. Pokud ano, můžete to využít a vylepšit. Pokud ne, můžete pomoci s jeho vytvořením.
Můžete znovu použít kód (je to open source) a pomoci nám jej vylepšit, pro každého na celé planetě.
Obecné zásady, aby byli vaši uživatelé spokojeni
- Můžete vyhledávat informace o produktech, včetně mnoha užitečných vypočtených hodnot.
- Pokud nemůžete získat informace o konkrétním produktu, můžete přimět uživatele, aby poslal fotografie a data, která pak zpracuje Open Food Facts AI a přispěvatelé, aby získali vypočítaný výsledek, který jim chcete ukázat.
- Můžete také implementovat kompletní tok tak, aby okamžitě získali výsledek s určitým úsilím na jejich straně.
Pokud vaši uživatelé neočekávají výsledek okamžitě (např. aplikace Inventory)
- Odešlete fotografie (přední strana/výživa/ingredience): pro vaše uživatele naprosto bezbolestná věc
- Open Food Facts AI „Robotoff“ vygeneruje některá odvozená data z fotografií
- Časem mezery v datech zaplní další aplikace a komunita Open Food Facts
Mobilní aplikace pro Android/iPhone/Flutter
- Odešlete nutriční fakta + kategorie > získejte Nutri-Score
- Odešlete ingredience > získejte skupinu NOVA (o ultrazpracování potravin), přísady, alergeny, normalizované ingredience, veganské, vegetariánské…
- Odešlete kategorii + štítky > brzy získáte Eco-Score (o dopadu na životní prostředí)
SDK
Můžete se podívat na nejčastější dotazy týkající se API a exportů dat a běžné otázky týkající se Open Food Facts
Snažíme se z deprecated Kotlin a Swift codebases udělat Kotlin a Swift SDK, pomoc vítána :-)
Můžete otevřít vlákno v našem úložišti dokumentace API
V případě jakýchkoli dotazů ohledně údajů nás můžete kontaktovat na reuse@openfoodfacts.org
SDK
| Ikona | Jazyk / Framework | Zdroje | Diskuse |
|---|---|---|---|
| Cordova (stará aplikace) | GitHub | Nedostupné | |
| DART | GitHub pub.dev | Nedostupné | |
| Elixir | GitHub | Slack Channel | |
| Přejít | GitHub | Slack Channel | |
| Jáva | GitHub | Slack Channel | |
| Spring Boot | GitHub | Slack Channel | |
| Kotlin | GitHub | Slack Channel | |
| NodeJS | GitHub | Slack Channel | |
| PHP | GitHub | Slack Channel | |
| PHP (Laravel) | GitHub | Slack Channel | |
| Python | GitHub | Slack Channel | |
| React Native | GitHub | Slack Channel | |
| Ruby | GitHub | Slack Channel | |
| Rezavá | GitHub | Slack Channel | |
| R | GitHub | Slack Channel | |
| Swift | GitHub | Slack Channel | |
| .NET/C# | GitHub | Slack Channel |
Diskuse o datech, API a exportu
Můžete se podívat na nejčastější dotazy týkající se API a exportů dat a běžné otázky týkající se Open Food Facts
Můžete se připojit k Slackové chatovací místnosti Open Food Facts, což je preferovaný způsob, jak klást otázky a diskutovat o API. Prosím položte své otázky v kanálu #api
Můžete otevřít vlákno v našem repozitáři dokumentace API
V případě jakýchkoli dotazů ohledně údajů nás můžete kontaktovat na reuse@openfoodfacts.org