<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Архивы работа с данными - BasesPro</title>
	<atom:link href="https://basespro.net/tag/rabota-s-dannymi/feed/" rel="self" type="application/rss+xml" />
	<link>https://basespro.net/tag/rabota-s-dannymi/</link>
	<description></description>
	<lastBuildDate>Tue, 05 May 2026 11:14:36 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://basespro.net/wp-content/uploads/2026/04/cropped-cropped-gemini_generated_image_c667ikc667ikc667-scaled-1-32x32.png</url>
	<title>Архивы работа с данными - BasesPro</title>
	<link>https://basespro.net/tag/rabota-s-dannymi/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Как парсить данные с государственных порталов закупок.</title>
		<link>https://basespro.net/kak-parsit-dannye-s-gosudarstvennyh-portalov-zakupok/</link>
					<comments>https://basespro.net/kak-parsit-dannye-s-gosudarstvennyh-portalov-zakupok/#respond</comments>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Tue, 05 May 2026 11:14:34 +0000</pubDate>
				<category><![CDATA[Гео-специфические базы]]></category>
		<category><![CDATA[44-ФЗ]]></category>
		<category><![CDATA[автоматизация сбора]]></category>
		<category><![CDATA[госзакупки]]></category>
		<category><![CDATA[парсинг]]></category>
		<category><![CDATA[работа с данными]]></category>
		<guid isPermaLink="false">https://basespro.net/?p=2697</guid>

					<description><![CDATA[<p>Цель:научиться извлекать данные с государственных порталов закупок для мониторинга тендеров, анализа рынка и поиска клиентских ниш через официальные интерфейсы. Исходные данные Компания — агрегатор маркетинговых данных для B2B, желает анализировать рынок госзакупок для таргетинга контрагентов. Порталы госзакупок (zakupki.gov.ru, ЕИС) содержат сведения о сотнях тысяч заказчиков, их предпочтениях и контрагентах в машиночитаемых форматах (XML, SOAP) . Проблема:&#160;для эффективного...</p>
<p>Сообщение <a href="https://basespro.net/kak-parsit-dannye-s-gosudarstvennyh-portalov-zakupok/">Как парсить данные с государственных порталов закупок.</a> появились сначала на <a href="https://basespro.net">BasesPro</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<p><strong>Цель:</strong><br>научиться извлекать данные с государственных порталов закупок для мониторинга тендеров, анализа рынка и поиска клиентских ниш через официальные интерфейсы.</p>



<h2 class="wp-block-heading" id="h-исходные-данные">Исходные данные</h2>



<p>Компания — агрегатор маркетинговых данных для B2B, желает анализировать рынок госзакупок для таргетинга контрагентов. Порталы госзакупок (zakupki.gov.ru, ЕИС) содержат сведения о сотнях тысяч заказчиков, их предпочтениях и контрагентах в машиночитаемых форматах (XML, SOAP) <a href="https://rubygems.org/gems/ox-tender-abstract/versions/0.9.3" target="_blank" rel="noreferrer noopener"></a><a href="https://github.com/SergeyRusanovv/Tender_search" target="_blank" rel="noreferrer noopener"></a><a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a>.</p>



<p><strong>Проблема:</strong>&nbsp;для эффективного сбора данных нужно разобраться в типах законов (44-ФЗ для госзаказчиков и 223-ФЗ для госкомпаний) и освоить инструменты, которые работают по официальному API, а не брут-форсом&nbsp;<a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a><a href="https://www.garant.ru/article/1929007/" target="_blank" rel="noreferrer noopener"></a><a href="https://old.clearspending.ru/news/sravnitelnaya-harakteristika-fz44-i-fz223/" target="_blank" rel="noreferrer noopener"></a>.</p>



<p><strong>Что нужно партнерам:</strong></p>



<ul class="wp-block-list">
<li>автоматически собирать информацию о закупках из открытых источников</li>



<li>структурировать данные для дальнейшего обогащения (контакты поставщиков)</li>



<li>не нарушать законодательство, используя официальные каналы</li>
</ul>



<h2 class="wp-block-heading" id="h-что-мы-сделали">Что мы сделали</h2>



<h3 class="wp-block-heading" id="h-шаг-1-разобрались-в-структуре-закупочного-законодательства">Шаг 1. Разобрались в структуре закупочного законодательства</h3>



<p>Российская система госзакупок базируется на двух ключевых законах&nbsp;<a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a>:</p>



<ul class="wp-block-list">
<li><strong>44-ФЗ</strong> — для государственных и муниципальных нужд (бюджетные учреждения, администрации, школы). Весь процесс строго формализован, контракты публикуются в едином формате <a href="https://old.clearspending.ru/news/sravnitelnaya-harakteristika-fz44-i-fz223/" target="_blank" rel="noreferrer noopener"></a><a href="https://www.garant.ru/article/1929007/" target="_blank" rel="noreferrer noopener"></a>.</li>



<li><strong>223-ФЗ</strong> — для закупок госкорпораций (Росатом, РЖД, Газпром), естественных монополий и компаний с госучастием. Правила гибче, но данные также выгружаются в ЕИС <a href="https://old.clearspending.ru/news/sravnitelnaya-harakteristika-fz44-i-fz223/" target="_blank" rel="noreferrer noopener"></a>.</li>
</ul>



<p>Знание этих типов позволяет точно фильтровать парсинг по источникам — например, искать либо&nbsp;<strong>только коммерческих, но «жирных» клиентов (223-ФЗ)</strong>, либо&nbsp;<strong>подрядчиков бюджета (44-ФЗ)</strong>&nbsp;<a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a>.</p>



<h3 class="wp-block-heading" id="h-шаг-2-использовали-официальный-единый-портал-nbsp-zakupki-gov-ru">Шаг 2. Использовали официальный Единый портал&nbsp;<a href="https://zakupki.gov.ru/" target="_blank" rel="noreferrer noopener">zakupki.gov.ru</a></h3>



<p>Вся разрешенная информация хранится в Единой информационной системе (ЕИС). Парсить оттуда данные можно, но лучше использовать <strong>официальный API-интерфейс</strong>, чтобы система не блокировала за слишком частые запросы.</p>



<p>В 2026 году заказчики также обязаны публиковать исчерпывающие данные о контрактах — включая сами планы-графики и исполненные контракты&nbsp;<a href="https://www.garant.ru/article/1929007/" target="_blank" rel="noreferrer noopener"></a>. Это дает возможность собирать истории компаний-конкурентов за несколько лет.</p>



<h3 class="wp-block-heading" id="h-шаг-3-настроили-выгрузку-через-машиночитаемые-форматы-xml-soap-api">Шаг 3. Настроили выгрузку через машиночитаемые форматы (XML / SOAP API)</h3>



<p>Портал предоставляет возможность запросить «Печатную форму извещения» и заменить в ссылке&nbsp;<code>view.html</code>&nbsp;на&nbsp;<code>viewXml.html</code>. В ответ вы получите структурированный XML-документ, содержащий все детали закупки — от реквизитов заказчика до даты публикации&nbsp;<a href="https://github.com/SergeyRusanovv/Tender_search" target="_blank" rel="noreferrer noopener"></a>.</p>



<p>Также существует&nbsp;<strong>библиотека на Ruby</strong>&nbsp;(<code>ox-tender-abstract</code>), которая умеет подключаться напрямую к SOAP API&nbsp;<code>zakupki.gov.ru</code>&nbsp;и возвращать Ruby-хэши с данными по тендерам, минуя сложный разбор XML вручную&nbsp;<a href="https://rubygems.org/gems/ox-tender-abstract/versions/0.9.3" target="_blank" rel="noreferrer noopener"></a><a href="https://rubygems.org/gems/ox-tender-abstract/versions.atom" target="_blank" rel="noreferrer noopener"></a>.</p>



<p><strong>Пример рабочего алгоритма (Python) на основе рекомендаций GitHub&nbsp;<a href="https://github.com/SergeyRusanovv/Tender_search" target="_blank" rel="noreferrer noopener"></a>:</strong></p>



<ol start="1" class="wp-block-list">
<li>Выполняем GET-запрос к странице результатов поиска (по 44-ФЗ или 223-ФЗ).</li>



<li>С помощью парсера (BeautifulSoup) извлекаем все ссылки на печатные формы (<code>.view.html</code>) из списка тендеров.</li>



<li>Модифицируем ссылку: заменяем <code>view.html</code> на <code>viewXml.html</code> — так получаем прямой доступ к XML-файлу с полной информацией о закупке.</li>



<li>Парсим XML, вытаскивая нужные поля: название, дату публикации, заказчика и цену контракта.</li>
</ol>



<p>Согласно исследованиям Финансового университета (№ 4, 2024), такой подход — сбор данных через парсинг открытых XML — уже активно используется для мониторинга цен и предотвращения завышения бюджета&nbsp;<a href="https://www.fa.ru/university/structure/scientific-educational-departments/itabd/bi/news/innovatsii-v-goszakupkakh-prepodavateli-finansovogo-universiteta-predlozhili-ispolzovat-parsing-dlya" target="_blank" rel="noreferrer noopener"></a><a href="http://risk-online.ru/archive/2024/04/1560-8816-2024-4-187-192/" target="_blank" rel="noreferrer noopener"></a>.</p>



<h3 class="wp-block-heading" id="h-шаг-4-парсинг-для-бизнес-анализа-и-лидогенерации">Шаг 4. Парсинг для бизнес-анализа и лидогенерации</h3>



<p>Собранные данные можно использовать не только для участия в торгах, но и для поиска B2B-клиентов:</p>



<ul class="wp-block-list">
<li><strong>Идентификация заказчиков</strong> — какие организации регулярно объявляют тендеры в вашей нише. Это сигнал к их потребностям.</li>



<li><strong>Анализ исполненных контрактов</strong> — если поставщик выигрывал контракты на похожее оборудование, он может стать вашим партнером или клиентом для доп. услуг.</li>



<li><strong>Сравнение фактических цен</strong> с рыночными уровнями для предложения скидки (см. практики выявления «переплат», рекомендуемые Минфином <a href="https://tender32.ru/site/Show/Content/3324" target="_blank" rel="noreferrer noopener"></a>).</li>
</ul>



<p>Использование подхода легального парсинга (через публичный API) полностью соответствует требованиям информационной открытости, заложенным в 44-ФЗ&nbsp;<a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a>.</p>



<h3 class="wp-block-heading" id="h-шаг-5-учитываем-изменения-2026-года">Шаг 5. Учитываем изменения 2026 года</h3>



<p>С 2026 года вступили в силу новые нормы: усилилась ответственность участников за достоверность данных, а комиссии по закупкам&nbsp;<strong>обязаны</strong>&nbsp;отстранять недобросовестных поставщиков при выявлении нарушений&nbsp;<a href="https://www.garant.ru/article/1929007/" target="_blank" rel="noreferrer noopener"></a>. Для парсера это означает, что данные из ЕИС (реестр недобросовестных поставщиков) становятся критически важными для скоринга потенциальных партнеров.</p>



<figure class="wp-block-image size-large"><img fetchpriority="high" decoding="async" width="1024" height="585" src="https://basespro.net/wp-content/uploads/2026/05/image-58-1024x585.png" alt="" class="wp-image-2716" srcset="https://basespro.net/wp-content/uploads/2026/05/image-58-1024x585.png 1024w, https://basespro.net/wp-content/uploads/2026/05/image-58-300x171.png 300w, https://basespro.net/wp-content/uploads/2026/05/image-58-768x439.png 768w, https://basespro.net/wp-content/uploads/2026/05/image-58-700x400.png 700w, https://basespro.net/wp-content/uploads/2026/05/image-58.png 1344w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<h2 class="wp-block-heading" id="h-результаты">Результаты</h2>



<p>По результатам сбора данных компания может получить массивы: названия компаний-поставщиков, их контакты, объёмы и частоту побед в закупках. Эти данные затем обогащаются (через утилиты проверки номеров, поиск контактов) и загружаются в CRM для отдела продаж.</p>



<p><strong>На выходе:</strong>&nbsp;мы имеем базу активных контрагентов, знаем их ресурсы (историю закупок) и можем персонализировать предложение.</p>



<h2 class="wp-block-heading" id="h-почему-это-работает-и-легально">Почему это работает и легально</h2>



<ul class="wp-block-list">
<li><strong>Используется API и XML</strong>, а не агрессивный скрейпинг с подменой User-Agent. Это снижает риск блокировки IP и защищает бизнес.</li>



<li><strong>Данные из ЕИС объективны</strong> — они проверяются контролирующими органами (ФАС, Казначейство) <a href="https://tender32.ru/site/Show/Content/3324" target="_blank" rel="noreferrer noopener"></a>.</li>



<li><strong>Парсинг госзакупок, а не крауд-скрейпинг</strong> полностью легален, так как закон (44-ФЗ) требует открытости информации, если она не составляет гостайны <a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a>.</li>



<li><strong>Научное сообщество (Финуниверситет) подтверждает</strong> полезность автоматического сбора данных для снижения финансовых рисков и повышения прозрачности <a href="https://www.fa.ru/university/structure/scientific-educational-departments/itabd/bi/news/innovatsii-v-goszakupkakh-prepodavateli-finansovogo-universiteta-predlozhili-ispolzovat-parsing-dlya" target="_blank" rel="noreferrer noopener"></a><a href="http://risk-online.ru/archive/2024/04/1560-8816-2024-4-187-192/" target="_blank" rel="noreferrer noopener"></a>.</li>
</ul>



<p><strong>Чек-лист парсинга госзакупок:</strong></p>



<ul class="wp-block-list">
<li>Изучил фундаментальные различия 44-ФЗ и 223-ФЗ <a href="https://www.bicotender.ru/faq/zakonodatelstvo-v-sfere-goszakupok.html" target="_blank" rel="noreferrer noopener"></a></li>



<li>Настроил доступ к официальному API zakupki.gov.ru (SOAP)</li>



<li>Для прототипа использовал Python + requests/BeautifulSoup и схему из репозитория Tender_search <a href="https://github.com/SergeyRusanovv/Tender_search" target="_blank" rel="noreferrer noopener"></a></li>



<li>Для массового Ruby-проекта подключил <code>ox-tender-abstract</code> <a href="https://rubygems.org/gems/ox-tender-abstract/versions/0.9.3" target="_blank" rel="noreferrer noopener"></a></li>



<li>Собираю не только текущие, но и завершённые контракты (архив)</li>



<li>Выходные данные сохраняю в формате CSV/JSON для последующего обогащения контактов</li>
</ul>
<p>Сообщение <a href="https://basespro.net/kak-parsit-dannye-s-gosudarstvennyh-portalov-zakupok/">Как парсить данные с государственных порталов закупок.</a> появились сначала на <a href="https://basespro.net">BasesPro</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://basespro.net/kak-parsit-dannye-s-gosudarstvennyh-portalov-zakupok/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
