08.09.2020 22:39
Starter
 
Столкнулся с задачей разбора чека самозанятого -
на входе имеем ссылку типа ссылка на чек

Если перейти по этой ссылке, то видим картинку чека. Из картинки вытащить информацию можно, но сложно, приходится картинку как-то распознать, затем полученный текст обработать. Распознание работает, мягко говоря, неточно. То точки пропускает, то скобки путает, то ещё что. В общем, тот ещё квест. На вопрос - как бы получить чек в нормальном формате ответа не нашёл кроме ругани на ФНС в общем и их программистов в частности.
Но экспериментальным путём было обнаружено, что если в строке адреса чека в конце вместо print подставить json, то получаем ссылку типа: ссылка на JSON чека самозанятого

Это нормальный json, который потом можно спокойно разобрать. К сожалению, никакой информации нигде про это нет. Но работает. Из бонусов - в json гораздо больше информации по чеку, чем на картинке. Из минусов - нет имени отправителя чека (т.е. самозанятого как такового). Есть только его ИНН, впрочем, в большинстве случаев этого достаточно.

Для чека по ссылке выше получаем информацию типа:
{"receiptId":"20005tnn66","services":[{"name":"Написание статьи","quantity":1,"serviceNumber":0,"amount":1000.00}],"operationTime":"2019-07-18T13:12:45.307+03:00","requestTime":"2019-07-18T13:12:45.307+03:00","registerTime":"2019-07-18T10:12:45.374Z","taxPeriodId":201907,"paymentType":"CASH","incomeType":"FROM_LEGAL_ENTITY","totalAmount":1E+3,"cancellationInfo":{"cancellationTime":"2019-07-18T10:14:12.292Z","registerTime":"2019-07-18T10:14:12.292Z","comment":"Чек сформирован ошибочно"},"sourceDeviceId":"33A084EE-5252-4F79-998A-DE9680B3DA87","clientInn":"7706456380","clientDisplayName":"ООО «ЦБП»","partnerDisplayName":null,"partnerInn":null,"inn":"772994823230"}

Форум на базе vBulletin®
Copyright © Jelsoft Enterprises Ltd.
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.