Пробоотбор, что ты со мной делаешь

EwRFD11WUAQklC8

Автор: Попов Алексей

Дата публикации: 04.05.2022 (статья из архива 09.07.2020)

Всё что связано с пробоотбором всегда является достаточно мутной темой, в разных местах интерпретируемой по-разному и причем часто не совсем корректно. А если это связано со статистикой и пробоотбором одновременно, то проблемы увеличиваются вдвойне. Все еще дополнительно усложняется тем, что на русский язык английские документы все переводят по-разному, что опять же не добавляет радости в работе с данными вопросами. Как только речь заходит о пробоотборе, все сразу напрягаются, потому что его регулирование очень хаотично, вызывает много вопросов, а это значит только одно — каждый аудитор будет иметь свое мнение, которые, плюс ко всему, скорее всего будут противоречить еще и друг другу. 

Но все же, всё это было бы ничего, все бы работали как работали и раньше (как кто хочет и может), но в новом ГОСТ ISO/IEC 17025-2019 появилось четкое упоминание того, что неопределенность результата измерения должна включать в себя в том числе и неопределенность пробоотбора. 

И тут понеслась.

Начну с того, что всяким теориям пробоотбора уже сто лет в обед. 

Всевозможные планы выборочного контроля существуют уже больше 50 лет. На них защитили кандидатские и докторские диссертации уже кто только смог.

Концепции неопределенности пробоотбора тоже уже немало лет. Тот же Еврахим-Ситак, еще в 2007 году выпустил свое первое руководство о том, как это все дело обсчитывать (уже даже есть новая редакция). Свое видение относительно пробоотбора выразили уже все регуляторные и международные авторитетные организации в своих руководствах и стандартах. 

Но понятно, что ничего не будет делаться, пока какие-нибудь регуляторы не начнут это требовать.

Ну и вот…

1 ПРОЛОГ

Скажем так: импровизации в переводе терминологии в различных документах — это одна хоть не главная, но значительная дополнительная проблема, с которыми постоянно сталкиваешься при попытке разобраться в чем-то по статистике. 

Все начинается с банального, что слово “sample” кто-то переводит как “выборка”, кто-то как “проба”, о чем как оказалось не все знают. Отсюда идут различия в переводе sampling — “отбор выборки” и “пробоотбор”. И дальше со всеми вытекающими.

Я буду использовать в статье понятие “проба” и из него производные, как более универсальное. Слово “выборка” лично у меня больше ассоциируется с теоретическими задачками по теории вероятности с белыми и черными шарами, поэтому увольте. Но, правда, иногда все равно хочется сказать слово “выборка” особенно, когда говоришь про отбор единиц фасованной продукции.

Давайте дальше.

Второе что нужно осознать, что на практике разделяют два принципиальных подхода к пробоотбору: отбор фасованной продукции и нерасфасованного материала. Мне такой перевод терминов больше всего нравится, чем другие существующие. 

В чем их суть? 

Фасованная продукция — это продукции партии, когда она к вам приходит, у вас производится или находится на складе в виде уже готовых отдельных элементов — расфасованных товаров, т.е. в упаковках с определенным количеством товара для непосредственного его использования. Тут все просто. Это обычные упаковки чего бы то ни было либо единичные самостоятельные изделия.

Нерасфасованный материал — термин, являющийся переводом понятия “bulk material”, который дословно гуглом переводится как “сыпучие материалы”, но по своей сути не совсем им являющийся, поэтому дословно не переводим. Можно называть и по другому, но в переводе «нерасфасованный материал» получается максимально понятна суть. Bulk material — это такие материалы и продукция, которые имеют непрерывную структуру и характеризуется длиной, площадью, объемом, временем или другими характеристиками, в пределах которых возможны определенные неоднородности. Это может быть пробоотбор из насыпи, из трубы, из реки или озера, из бочки, прицепа, вагона, цистерны, из почвы, воздуха помещения, с поверхностей в помещении, из организма человека и т.д.

Я думаю уловили суть. Такое деление важно, т.к. на основании него по разному строятся подходы к пробоотбору.

И третье, на чем бы хотел заострить внимание, что в зависимости от типа пробоотбора компании используют принципиально разные планы испытания и оценивания после отбора точечных проб продукции / материала:

фасованная продукция может испытываться двумя способами: 

а) с испытанием каждой отдельной единицы в отобранной пробе, определением соответствия / несоответствия по каждой, и решением о принятии / браковке всей партии на основании количества несоответствующих единиц продукции из этой отобранной пробы (еще называется как контроль на по альтернативному признаку);

b) с испытанием каждой отдельной единицы в отобранной пробе, но с получением “средней температуры по больнице” — усредненного значения показателя из всех единиц, и принятия решения по всей партии исходя из этого усредненного показателя (принятое название — контроль по количественному признаку).

нерасфасованные материалы испытываются также двумя способами:

a) отбираются несколько точечных проб в разных местах материала, а потом формируется установленным способом через определенные стадии объединенная проба, которая уже является усредненной и испытывается уже только она с получением опять же “средней температуры по больнице”, а решение по всему материалу принимается на основании этого среднего значения.

b) отбираются несколько точечных проб в разных местах материала и измерения проводятся для каждой и в зависимости от того, соответствует ли результат в каждой точке необходимому допуску, принимается решение о соответствии всего материала;

Все эти принятые подходы приправляются словами про некую однородность, репрезентативность, представительность и другими умными и красивыми словами.

Сделаю уточнения.

Уточнение 1: до этого и впоследствии в статье я говорю про распространенные и наиболее часто используемыми подходы, ни в коем случае не подписываясь под их правильностью. Просто констатация факта.

Уточнение 2: следите за названиями глав и словами расфасованный и нерасфасованный, т.к. по статье они меняются местами.

Глава 1. Пробоотбор нерасфасованного материала

В принципе, всем очевидно, что нерасфасованная продукция по умолчанию значительно неоднородна в различных мерах (по длине, площади, объему и / или времени). Если отбирать в разных, например, местах бочки сыпучего материала, то показатели будут отличаться между собой.

При этом под значительностью неоднородности пробоотбора понимается не то, что там ооочень большая неоднородность, а в понимании того, что неопределенность пробоотбора (разброс значений показателя между измерениями в разных местах образца) как минимум соизмерима, а вообще в разы больше, чем неопределенность аналитическая (та, что обусловлена только работой в лаборатории). 

Схема 1. Общая концепция и место неопределенности пробоотбора в результате измерения

Пока все кажется логичным. Значит идем дальше.

Пробоотбор нерасфасованной продукции описывается двумя основными документами, спор о разнице которых идет уже тысячелетиями: план пробоотбора (sampling plan) и процедура (которую у нас любят называть как метод / методика) пробоотбора (sampling procedure).

Грань между этими понятиями действительно тонкая, но все-таки есть. 

Процедура пробоотбора — это документ, описывающий физические действия, их порядок и способ применения, которые необходимы, для того, чтобы правильно отобрать пробу. Это описание пробоотборника, угол, сила, глубина погружения, время отбора и т.п. Для примера, на основании сегодняшней повестки дня: методика пробоотбора для PCR теста на COVID-19 из горла будет описывать порядок получения правильного мазка, чтобы этим самым правильно отобрать материал с горла, чтобы снизить вероятность ложноотрицательного теста.

План пробоотбора — это документ описывающий организационные моменты отбора проб: количество точечных проб, количество этапов отбора, места отбора в пространстве / объеме / длине и времени, условия транспортировки, ответственных и аналогичные детали.

На мой взгляд нет ничего плохого, если объединять данные документы, но просто методика пробоотбора всегда для конкретного материала одинаковая, а план пробоотбора будет отличаться в зависимости от масштаба целевого объекта (еще одно понятие, которое означает весь тот ареал нерасфасованного материала, который необходимо оценить, отобрав из него пробу (партия, цистерна, озеро, организм человека, помещение и т.д.)).

Разделение понятий на процедура и план пробоотбора применяется как правило только к пробоотбору из нерасфасованного материала.

Глава 2. Пробоотбор расфасованной продукции

Пробоотбор расфасованной продукции одновременно и проще, и сложнее, чем нерасфасованной.

Одно из основных отличий состоит в том, что понятия точечной пробы, объединённой пробы и т.п. понятия для проб расфасованной продукции зачастую банально не применимы, т.к. параметры принадлежат целой единице продукции и каким-то образом объединив или гомогенизировав несколько единиц продукции получится какая-то бессмыслица. Масса / объём продукции, наличие повреждений, органолептика, примеси, идентификация — что будет, если усреднить?. Расфасованная продукция анализируется раздельно по каждой единице, т.к. отобрать “самую среднюю” единицу продукции невозможно.

Второе важное отличие, что здесь действует предположение, что отобрав достаточный объем пробы и оценив определенным способом, можно достаточно достоверно сказать какой максимальный уровень брака возможен в партии (это, мягко говоря, не так, но мы говорим, про теории, на которых строится многими используемая теория пробоотбора). 

В отличии от пробоотбора нерасфасованного материала, при отборе расфасованной продукции понятие методики / процедуры пробоотбора применяется редко. Это в принципе и понятно, т.к. весь ваш пробоотбор заключается в том, чтобы дотопать до склада или машины и взять в корзинку нужное количество упаковок. Но все же похожее понятие иногда встречается и называется как Процедура (или опять же метод / методика) приемочного пробоотбора (acceptance sampling procedure) и в основном описывает то, как не испортить пробы при их отборе передав их в лабу в целостности и сохранности.

Именно поэтому пробоотбор продукции описывается зачастую лишь количеством или процентом от партии единиц продукции, которые нужно проинспектировать. Это число описывают в Планах приемочного пробоотбора (acceptance sampling plan).

Как-то так.

А теперь давайте приступим к тому, зачем мы здесь с вами собрались. К неопределенности пробоотбора.

Глава 3.1 Неопределенность пробоотбора расфасованного материала

Начнем с расфасованной продукции, для которой на основании распространенного подхода, данных вопрос выходит как более простой.

Здесь мы встречаемся с теми самыми Планами выборочного приемочного контроля, о которых вы скорее всего как минимум слышали, где нужно отобрать какое-то число продукции в зависимости от критичности и всяких умных показателей, и на основании того либо иного подхода к оцениванию (речь о тех двух подходах для расфасованной продукции из главы 1) принять решение о принятии / браковке партии. Опять же больше рассказывать не буду, т.к. у этого подхода много проблем и сомнений в его хоть какой-то применимости в жизни, поэтому при желании почитаете сами. Так вот ISO и некоторые другие организации намекают на то, что вы будете пользоваться при инспектировании продукции именно подобными «статистически обоснованными» подходами к пробоотбору расфасованной продукции.

«В чем простота, Алексей?» — скажете вы.

Простота в том, что для расфасованной продукции не нужно считать ту самую злободневную неопределенность пробоотбора. Почему? Здесь всё зависит от подхода к оцениванию отобранных проб, о которых говорилось в главе 1. 

При оценивании по альтернативному признаку, принятие решение производится по каждой отдельной единице, а значит в процесс измерения и принятие решения по этой единице банально не входит неопределенность пробоотбора (принятие решения по каждой единице продукции происходит только с учетом аналитической неопределенности), т.к. неопределенность приписывается к измеренной величине только на одну штуку товара. В данном случае уже на стадии принятия решения по всей партии каждая отобранная единица продукции уже классифицирована по качественному признаку (произошел переход из количественного признака в качественный) — соответствует или не соответствует, а значит неопределенность пробоотбора опять не применима. 

Сделаю уточнение 1 или 2 единицы продукции — это не тот размер пробы продукции, на основании которых можно сделать “статистически обоснованное” решение о принятии решения. Тут смотрите соответствующие документы, но вангую, что вы выпадете в осадок, когда узнаете сколько вам нужно будет испытать и выкинуть единиц продукции (если испытания разрушающие).

При оценивании по количественному признаку, принятие решения происходит по усредненному значению показателю из определенного количества испытанных образцов. Здесь уже действительно хочется припахать неопределенность пробоотбора, т.к. между единицами продукции действительно будет вариация. Но здесь по данным планам контроля вам достаточно оценить стандартное отклонение между полученными (до усреднения) значениями показателя и по определенным формулам принять решение (см. соотв. документы).

И нет, это стандартное отклонение — это не неопределенность пробоотбора, потому что вы это поймете в следующей главе.

Глава 3.2 Неопределенность пробоотбора нерасфасованного материала

Так вот. Вы хотели про неопределенность пробоотбора? Вот мы к ней пришли.

Начнем с подхода 2а) из Главы 1 (оценивание из усредненной / объединенной пробы).

Для чего здесь неопределенность пробоотбора? Она в теории, позволит учесть весь интервал значений, которые можно получить при отборе из любого участка целевого объекта. Идиалити.

Как она рассчитывается? Достаточно просто. Основным методом является обычный дисперсионный анализ ANOVA на основании метода двойных проб. Далее пояснять не буду, потому что, во-первых, вы сможете сами почитать в документе Еврахим-Ситак, а, во-вторых, потому что опять же есть серьезные сомнения считать, что данный метод не рабочий и что он содержит, как всегда, в своей основе одну единственную, но решающую концептуальную ошибку.

На чем построена философия неопределенности методик (аналитической части)? На простой идее того, что если вы будете четко выполнять методику измерений, соблюдать все условия, использовать необходимое оборудование и режимы, а методика в свою очередь будет в достаточной степени стандартизирована, то — неопределенность методики будет всегда одинаковой (измерительный процесс стабилен / управляем), а истинное значение результата измерения будет лежать в границах интервала охвата с определенной вероятностью. Какие бы там не были положены в основу расчета допущения и приближения, но концептуально подход верен.

Основной же подход к расчету неопределенности пробоотбора основан, грубо говоря, на том, что вы отбираете точечные пробы (инкрименты) в разных местах целевого объекта в большом количестве последовательных партий продукции или материала и рассчитываете некий максимальный разброс значений, который присущ данному материалу. 

Норм? Не норм. 

Почему? Потому что как идеально бы вы не отбирали пробу, как четко не выполняли методику и план пробоотбора, насколько не был бы опытен оператор, неопределенность пробоотбора почти не зависит от процесса пробоотбора, как для сравнения зависит аналитическая неопределенность измерения от выполнения процесса измерения. Неопределенность пробоотбора зависит, в самой большей степени, от природы целевого объекта, которую вы испытываете, от ее неоднородности. Да, конечно, от процесса пробоотбора тоже что-то зависит, но это в меньшей степени и этим процессом можно управлять, а вот управлять неоднородностью целевого объекта невозможно, т.к. вы не выбираете материалы, которые вам нужно исследовать.

В теории, если вы занимаетесь SPC (статистическим контролем процессов) своих технологических процессов и доказали, что процесс находится в контролируемом состоянии, то тогда можно получить стабильное распределение показателя в материале (но тогда возникает вопрос в надобности вообще выборочного контроля). Но это единственный вариант. Если вы аутсорсинговая лаборатория или лаборатория входного контроля, то вы явно не владеете информацией о том, какая продукция идет от поставщика, кого вы проверяете. Если говорить про лаборатории, исследующие почвы, реки, озера, организм человека и т.п., то понятие как предсказуемая неоднородность среды вообще не существует.

И что? Да, там можно вводить всякие показатели-аналоги внутрилабораторного контроля качества, типа предела повторяемости между точечными пробами и подобное, но что делать, когда повторяемость не прошла, потому что к вам пришел материал еще более неоднородный, чем был среди тех, на которых вы рассчитывали неопределенность? Заново проводить расчет неопределенности?

Явно нужен другой подход, но какой — это уже другой вопрос. 

С другой стороны, что бы я тут не написал, а требование оценки неопределенности пробоотбора в ГОСТ ISO/IEC 17025-2019 останется как минимум до следующего пересмотра. Поэтому тут можно только посочувствовать лабораториям, которые занимаются испытанием нерасфасованной продукции.

Также хочу обратить внимание, раз уже все на то пошло, что знание неопределенности пробоотбора нерасфасованной продукции не всегда (даже в теории) имело бы смысл, т.к. в ряде случаев знание “средней температуры по больнице” является необходимым и достаточным. Например, когда вы проверяете влажность зерна, отбирая точечные пробы в разных местах прицепа, или жирность молока, отбирая в разных местах цистерны, а потом готовите усредненную пробу и испытываете только ее. В таких ситуациях неопределенность не важна, т.к. весь прицеп зерна или вся цистерна молока пойдет сразу в производство и такой параметр как влажность / жирность усреднится и как раз значимым будет лишь усредненная влажность / жирность во всем прицепе / цистерне, а не какая она была в разных местах пространства. Аналогичная ситуация, если вы перед использованием дополнительно гомогенизируете материал.

Если сказать про подход 2b) из главы 1, то здесь зависит от смысла, который вы вкладываете в эти точечные пробы. Если вы рассматриваете их как отражающие свойство близлежащего материала, то нужно рассматривать это ближлежащее пространство как целевые объекты и рассчитывать неопределенность для каждой из них. Если вы рассматриваете точечные пробы как пробы из конкретного места без какого-то метасмысла, то в теории можно пренебречь неопределенностью пробоотбора и принимать партию, если все точечные пробы прошли по критерию соответствия.

Заключение

Тема пробоотбора действительно скользкая и содержит кучу пробелов регулирования и много слишком идеализированных методов. 

В то же время от пробоотбора зависит корректность интерпретации результатов испытаний, т.к. именно набор данных является самой сложной и проблемной частью любых статистических исследований.

В принципе, все уже давно придумано и изобретать велосипед не нужно, но среди всех теоретических концепций, работающих только на бумаге, каждому специалисту контроля качества придётся искать именно пригодные для их целей, исходя из своей специфики процесса. А что ещё сложнее — потом доказывать аудиторам, что «ты не верблюд».

 

Используемые источники:

(1) ГОСТ ISO/IEC 17025-2019 (IDT, ISO/IEC 17025:2017) Общие требования к компетентности испытательных и калибровочных лабораторий.

(2) ISO 3534-2:2006 (в IDT редакциях СТБ ISO 3534-2-2018, ГОСТ Р ISO 3534-2-2019) Statistics — Vocabulary and symbols — Part 2: Applied statistics

(3) Методы анализа и отбора проб. Codex Alimentarius. CAC/GL 50-2004 / FAO & WHO, 2007 // пер. на русск. — М.: Весь Мир, 2007. — 103 с.

(4) Выход из кризиса (Out of Crisis) / Эдвардс Деминг // Пер. с англ. – М: Альпина, 2019. — 417 с.

(5) Measurement uncertainty arising from sampling. 2nd edition / Eurachem Guides // Eurochem-Citac. — 2019. — 120 p.

(6) Статистическое управление процессами (Understanding Statistical Process Control) / Д. Уилер, Д. Чамберс // пер. с англ. — М: Альпина, 2019. — 409 с.