Údaje
Podmínky pro opětovné použití
Databáze Open Food Facts je k dispozici pod Open Database License.
Jednotlivý obsah databáze je k dispozici pod licencí k obsahu databáze.
Obrázky produktů jsou k dispozici pod licencí Creative Commons Uveďte autora ShareAlike.
Mohou obsahovat grafické prvky podléhající autorským právům nebo jiným právům, které mohou být v některých případech reprodukovány (práva na nabídky nebo fair use).
Před opětovným použitím dat si prosím přečtěte Podmínky používání a opětovného použití.
Řekněte nám o svém opětovném použití
Velmi nás zajímá zjištění, k čemu se používají data Open Food Facts. To není povinné, ale velmi bychom ocenili, kdybyste nám řekli o svém opětovném použití, abychom ho mohli sdílet s komunitou Open Food Facts. Můžete také vyplnit tento formulář a získat tak šanci, aby byla vaše aplikace doporučena.
Export dat Open Food Facts
Výpisy a exporty databáze se generují každou noc. Databáze je velmi velká, takže můžete najít různé způsoby, jak použít datav závislosti na variantě exportu.
Informace o různých polích pro výpis MongoDB a exporty CSV jsou k dispozici na adrese https://world.openfoodfacts.org/data/data-fields.txt
Výpis MongoDB
Data pro všechny produkty jsou k dispozici ve výpisu databáze MongoDB.
- Odkaz
- https://static.openfoodfacts.org/data/openfoodfacts-mongodbdump.gz
- sha256sum
- https://static.openfoodfacts.org/data/gz-sha256sum
- md5sum
- https://static.openfoodfacts.org/data/gz-md5sum
Delta Export
Denní delta exporty jsou poskytovány za předchozích 14 dní. Seznam aktuálně dostupných delta souborů lze nalézt na https://static.openfoodfacts.org/data/delta/index.txt.
Každý řádek představuje soubor, který je dostupný na adrese https://static.openfoodfacts.org/data/delta/{filename}
.
Název souboru obsahuje UNIX časové razítko prvního a poslední změny obsažené v souboru JSON, aby delta soubory mohly být importovány (po extrakci) pomocí mongoimport
v abecedním pořadí.
Vezměte prosím na vědomí, že vzhledem k povaze mongoexport
vám delta soubory nemohou říci o smazaných produktech. Chcete-li odebrat odstraněné produkty z databáze, musíte importovat celý výpis MongoDB.
Export dat JSONL
Celá databáze je k dispozici také ve formátu JSONL (někdy nazývaném LDJSON nebo NDJSON), kde je každý řádek objektem JSON. Představuje stejná data jako export MongoDB. Soubor je komprimován pomocí gzip.
Vhodným způsobem využití databáze je použití DuckDB, analytický nástroj v průběhu procesu určený ke zpracování velkého množství údajů v zlomku sekund. Můžete si přečíst náš příspěvek na blogu, kde vás provázíme průzkumem a zpracováním databáze Open Food Facts s DuckDB
Export dat CSV
Zjednodušená verze výpisu JSONL je k dispozici také ve formátu Parquet. Při převodu jsme filtrovali sloupce, které obsahují duplicitní informace, slouží k internímu ladění nebo jsou pro uživatele jednoduše irelevantní.
Ukázalo se, že formát Parquet je vhodný:
- Data jsou organizována podle sloupců, nikoli podle řádků, což šetří úložný prostor a urychluje analytické dotazy, tj. můžete vybrat pouze sloupce, které vás zajímají, a optimalizovat tak výkon dotazů, a to i na méně výkonných počítačích.
- Vysoce účinná komprese a dekomprese dat, díky čemuž je vhodná pro ukládání a sdílení velkých datových sad jakéhokoli druhu,
- Podporuje komplexní datové typy a pokročilé vnořené datové struktury.
Soubor dat je k dispozici na Hugging Face, kolaborativním ekosystému strojového učení, kde mohou vývojáři a výzkumníci sdílet modely a datové sady.
Další informace najdete na Wiki, včetně pokynů pro opětovné použití dat a příkladů dotazů, jak začít.Export dat RDF
Data pro všechny produkty nebo některé produkty lze stáhnout ve formátu CSV (čitelný pomocí LibreOffice, Excel a mnoha dalších tabulkových softwarů) prostřednictvím formuláře pro pokročilé vyhledávání.
- Odkaz
- Food: https://static.openfoodfacts.org/data/en.openfoodfacts.org.products.csv.gz (compressed CSV in GZIP format: ~ 0.9 Gb, uncompressed: ~ 9 Gb)
- Cosmetics: https://static.openbeautyfacts.org/data/en.openbeautyfacts.org.products.csv.gz
- Pet Food: https://static.openpetfoodfacts.org/data/en.openpetfoodfacts.org.products.csv.gz
- All other products: https://static.openproductsfacts.org/data/en.openproductsfacts.org.products.csv.gz
Kódování souboru je Unicode UTF-8. Znak, který odděluje pole, je <tab> (tabulka).
Export obrazových dat
The database is also available in the RDF format (this is an experiment, not actively maintained anymore). Můžete si přečíst oznámení ve francouzštině.
Hledáme pomoc s OpenAPI
Všechny obrázky a výsledky OCR lze stáhnout z našeho serveru nebo z AWS (prostřednictvím AWS Open Data Program). Check out our documentation to learn more about how to download images
Dokumentace OpenAPI pro JSON API
K dispozici je také JSON API pro čtení dat pro produkt. This API is in particular used in the Open Food Facts mobile app.
API v průběhu času vylepšujeme, ale dbáme na zachování zpětné kompatibility. Prosím, kontaktujte nás, pokud ho používáte, abychom Vás mohli informovat o možných změnách.
Discover our APIContributing to improving our API and OpenAPI documentation
We're eager to finish the documentation of the API, add use-cases, and automate SDK generation. If you are an OpenAPI connoisseur, you are very welcome to help.
You are very welcome to use the API for production cases, as long as 1 API call = 1 real scan by a user. Any attempt to scrape the database using the API will very likely be blocked, as full daily exports are available on this very page.
Also, sending an HTTP header with your API call is a good way we can get in touch, should any issue arise.
XML API (unsupported)
Kódy pro oficiální mobilní aplikace Open Food Facts jsou dostupné na GitHubu: Flutter, Kotlin Android a Swift iOS
Uvažujeme o přeměně zastaralých kódových základen Kotlinu a Swiftu na SDK Kotlinu a Swiftu, pomoc vítána :-)
Toto API není aktivně udržováno a není oficiálně zdokumentováno.Obaly a sady SDK
Pravděpodobně máme wrapper pro váš oblíbený programovací jazyk. Pokud ano, můžete to využít a vylepšit. Pokud ne, můžete pomoci s jeho vytvořením.
Můžete znovu použít kód (je to open source) a pomoci nám jej vylepšit, pro každého na celé planetě.
Obecné zásady, aby byli vaši uživatelé spokojeni
- Můžete vyhledávat informace o produktech, včetně mnoha užitečných vypočtených hodnot.
- Pokud nemůžete získat informace o konkrétním produktu, můžete přimět uživatele, aby poslal fotografie a data, která pak zpracuje Open Food Facts AI a přispěvatelé, aby získali vypočítaný výsledek, který jim chcete ukázat.
- Můžete také implementovat kompletní tok tak, aby okamžitě získali výsledek s určitým úsilím na jejich straně.
Pokud vaši uživatelé neočekávají výsledek okamžitě (např. aplikace Inventory)
- Odešlete fotografie (přední strana/výživa/ingredience): pro vaše uživatele naprosto bezbolestná věc
- Open Food Facts AI „Robotoff“ vygeneruje některá odvozená data z fotografií
- Časem mezery v datech zaplní další aplikace a komunita Open Food Facts
Mobilní aplikace pro Android/iPhone/Flutter
- Odešlete nutriční fakta + kategorie > získejte Nutri-Score
- Odešlete ingredience > získejte skupinu NOVA (o ultrazpracování potravin), přísady, alergeny, normalizované ingredience, veganské, vegetariánské…
- Odešlete kategorii + štítky > brzy získáte Eco-Score (o dopadu na životní prostředí)
SDK
Můžete se podívat na nejčastější dotazy týkající se API a exportů dat a běžné otázky týkající se Open Food Facts
Snažíme se z deprecated Kotlin a Swift codebases udělat Kotlin a Swift SDK, pomoc vítána :-)
Můžete otevřít vlákno v našem úložišti dokumentace API
V případě jakýchkoli dotazů ohledně údajů nás můžete kontaktovat na reuse@openfoodfacts.org
SDK
Icon | Language / Framework | Zdroje | Discussion |
---|---|---|---|
Cordova (Old App) | GitHub | Nedostupné | |
DART | GitHub pub.dev | Nedostupné | |
Elixir | GitHub | Slack Channel | |
Go | GitHub | Slack Channel | |
Java | GitHub | Slack Channel | |
Spring Boot | GitHub | Slack Channel | |
Kotlin | GitHub | Slack Channel | |
NodeJS | GitHub | Slack Channel | |
PHP | GitHub | Slack Channel | |
PHP (Laravel) | GitHub | Slack Channel | |
Python | GitHub | Slack Channel | |
React Native | GitHub | Slack Channel | |
Ruby | GitHub | Slack Channel | |
Rezavá | GitHub | Slack Channel | |
R | GitHub | Slack Channel | |
Swift | GitHub | Slack Channel | |
.NET/C# | GitHub | Slack Channel |
Diskuse o datech, API a exportu
Můžete se podívat na nejčastější dotazy týkající se API a exportů dat a běžné otázky týkající se Open Food Facts
Můžete se připojit k Slackové chatovací místnosti Open Food Facts, což je preferovaný způsob, jak klást otázky a diskutovat o API. Prosím položte své otázky v kanálu #api
You can open a thread on our API documentation repository
V případě jakýchkoli dotazů ohledně údajů nás můžete kontaktovat na reuse@openfoodfacts.org