Цель любого инструмента бизнес-аналитики - дать Анализ данных лучший поток. Если кто-то, как профессионал, сталкивается с трудностями при использовании инструмента при решении проблемы, состояние потока нарушается. Одна из частых причин этой проблемы - необходимость работать с данными, которые были агрегированы в разные Уровень детализации в таблице (LOD) .
Размещение Tableau на вершине стопки в шестой раз подряд в Magic Quadrant компании Gartner определенно что-то говорит о ее спросе на рынке. Это, наверное, лучшее время для .
Этот блог поможет вам понять выражения LOD и обсудит следующие темы:
- Зачем вам нужен уровень детализации в Tableau?
- Что такое уровень детализации в Tableau?
- Выражения уровня строки и уровня просмотра
- Типы выражений LOD
- Агрегация и выражения LOD
- Фильтры и выражения LOD
- Создание выражений LOD
- Источники данных, поддерживающие уровень детализации в таблице
- Табличные вычисления и уровень детализации в Таблице
- Ограничения уровня детализации в Tableau
Tableau LOD: Зачем вам LOD?
При анализе данных часто возникают вопросы. Эти вопросы часто просто задать, но на них сложно ответить. Часто они звучат примерно так:
питон __init__
Чтобы ответить на эти типы вопросов, был введен новый синтаксис под названием Уровень детализации в Таблице 9.0. Этот новый синтаксис и упрощает, и расширяет язык вычислений Tableau, позволяя напрямую решать эти вопросы.
Таблица LOD: Что такое LOD?
Выражения уровня детализации представляют собой элегантный и эффективный способ ответить на вопросы, включающие несколько уровней детализации в одной визуализации.
Уровень детализации в табличных выражениях или выражения LOD позволяют вычислять значения на уровне источника данных и уровне визуализации. Однако выражения LOD дают вам еще больший контроль над уровнем детализации, который вы хотите вычислить. Их можно выполнять в более гранулированный уровень (ВКЛЮЧИТЬ расчет), a менее гранулированный уровень (EXCLUDE Calculation) или полностью независимый мягкий l (ФИКСИРОВАННЫЙ расчет).
Таблица LOD: Выражения уровня строки и уровня просмотра
Уровень строки
В Таблице выражения, ссылающиеся на неагрегированный столбцы источника данных вычисляются для каждой строки в базовой таблице. В этом случае размерность выражения равна уровень строки . Пример выражения на уровне строки:
[Продажи] / [Прибыль]
Этот расчет будет оцениваться в каждой строке базы данных. Значение продаж в каждой строке будет разделено на значение прибыли в этой строке, в результате чего появится новый столбец с результатом умножения (коэффициент прибыли).
Если вы создаете расчет с этим определением, сохраните его под именем [ProfitRatio], а затем перетащите его из Панель данных на полку, Tableau обычно объединяет вычисленное поле для представления:
SUM [ProfitRatio]
Уровень просмотра
Напротив, выражения, ссылающиеся на агрегированный столбцы источника данных вычисляются с размерностью, определяемой измерениями в представлении. В этом случае размерностью выражения является уровень просмотра. Пример выражения уровня представления:
SUM (Продажи) / SUM (Прибыль)
Если вы перетащите это вычисление на полку (или введите его прямо на полке в качестве специального вычисления), Tableau заключит его в Функция AGG :
AGG (СУММ (продажи) / СУММ (прибыль))
Это то, что известно как Агрегированный расчет .
Таблица LOD: Агрегация и выражения LOD
Выражение LOD грубее, чем уровень детализации представления
Выражение имеет более грубый уровень детализации, чем представление, когда оно ссылается на подмножество размеров в представлении.
Например, для представления, содержащего размеры [Категория] и [Сегмент], вы можете создать уровень детализации в Tableau, который использует только одно из следующих измерений:
{ИСПРАВЛЕНО [сегмент]: SUM ([продажи])}
В этом случае выражение имеет более грубый уровень детализации, чем представление. Его значения основаны на одном измерении ([Сегмент]), тогда как представление основывается на двух измерениях ([Сегмент] и [Категория]).
В результате использование уровня детализации выражения в представлении приводит к репликации определенных значений, то есть к появляются несколько раз .
Выражение LOD лучше, чем уровень детализации представления
Выражение имеет более высокий уровень детализации, чем представление, когда оно ссылается на надмножество размеров в представлении.
Когда вы используете такое выражение в представлении, Tableau будет агрегировать результаты до уровня представления. Например, следующий уровень детализации в Tableau ссылается на два измерения:
{ИСПРАВЛЕНО [сегмент], [категория]: SUM ([продажи])}
Когда это выражение используется в представлении с уровнем детализации только [Сегмент], значения должны быть агрегированы . Вот что вы увидите, если перетащите это выражение на полку:
СРЕДНЕЕ ([{ИСПРАВЛЕНО [сегмент]], [Категория]]: СУММ ([Продажи]])}])
An агрегирование (в данном случае среднее значение) автоматически присваивается Tableau. При необходимости вы можете изменить агрегирование.
Добавление выражения LOD в представление
Агрегируется или реплицируется выражение уровня детализации в таблице в представлении, определяется тип выражения и детализация .
- Выражения INCLUDE будут иметь либо тот же уровень детализации, что и представление, либо более высокий уровень детализации, чем представление. Следовательно, значения никогда не будут воспроизведены.
- ФИКСИРОВАННЫЕ выражения могут иметь более высокий уровень детализации, чем представление, более грубый уровень детализации или такой же уровень детализации. Необходимость агрегирования результатов ФИКСИРОВАННОГО уровня детализации зависит от того, какие измерения находятся в представлении.
- Выражения EXCLUDE всегда заставляют реплицированные значения появляться в представлении. Когда вычисления, включающие выражения с уровнем детализации EXCLUDE, помещаются на полку, Tableau по умолчанию принимает значение Агрегация ATTR в отличие от SUM или AVG, чтобы указать, что выражение на самом деле не агрегируется и что изменение агрегации не повлияет на представление.
Выражения уровня детализации всегда автоматически объединяются в агрегат, когда они добавляются на полку в представлении, если только они не используются в качестве измерений.
Таблица LOD: Фильтры и выражения LOD
Изображение здесь изображаетпорядок выполнения фильтров сверху вниз.Текст справа показывает, где в этой последовательности вычисляются выражения LOD.
Фильтры извлечения (отмечены оранжевым) актуальны только в том случае, если вы создаете извлечение таблицы из источника данных. Фильтры табличных вычислений (темно-синие) применяются после выполнения вычислений и поэтому скрывают метки, не отфильтровывая базовые данные, используемые в вычислениях.
фреймворк, управляемый данными в примере selenium webdriver
ФИКСИРОВАННЫЕ вычисления применяются перед фильтрами измерений, поэтому, если вы не продвинете поля на полке «Фильтр» для повышения производительности представления с помощью контекстных фильтров, они будут проигнорированы.
Таблица LOD: Типы выражений LOD
ВКЛЮЧИТЬ расчет
INCLUDE вычисляет значения, используя указанные измерения в дополнение к любым измерениям в представлении. Этот уровень детализации наиболее полезен при включении измерения, которого нет в представлении.
Например: {ВКЛЮЧИТЬ [Имя клиента]: SUM ([Продажи])}
ИСКЛЮЧИТЬ расчет
EXCLUDE явно удаляет измерения из выражения, то есть вычитает размеры из уровня детализации представления. Этот уровень детализации в Таблице наиболее полезен для исключения измерения в представлении.
Например: {EXCLUDE [Region]: SUM ([Sales])}
ФИКСИРОВАННЫЙ расчет
FIXED вычисляет значения с использованием указанных измерений без ссылки на уровень детализации представления, то есть без ссылки на какие-либо другие измерения в представлении. Этот уровень детализации выражения также игнорирует все фильтры в представлении, кроме контекстных фильтров, фильтров источника данных и фильтров извлечения.
Например: {ИСПРАВЛЕНО [Регион]: SUM ([Продажи])}
Таблица LOD: Создание выражений LOD
Синтаксис выражения LOD
Уровень детализации имеет следующую структуру:
ВКЛЮЧАЮТ
Шаг 1. Настройте визуализацию
- Откройте рабочий стол Tableau и подключитесь к Образец-Супермаркет сохраненный источник данных.
- Перейдите к новому листу.
- От Данные в области 'Размеры' перетащите Область, край к Столбцы Полка.
- От Данные на панели 'Меры' перетащите Продажи к Рядов Полка. Появится столбиковая диаграмма, показывающая сумму продаж для каждого региона.
Шаг 2: Создайте выражение LOD
Вместо суммы всех продаж по региону, возможно, вы захотите также увидеть средние продажи на одного покупателя по каждому региону. Для этого вы можете использовать выражение LOD.
- Выбрать Анализ > Создать вычисляемое поле.
- В открывшемся редакторе расчетов выполните следующие действия:
- Назовите расчет «Продажи на клиента».
- Введите следующее выражение LOD:
{ВКЛЮЧИТЬ [Имя клиента]: SUM ([Продажи])}
- Когда закончите, нажмите ОК. Вновь созданное выражение уровня детализации добавляется на панель «Данные» в разделе «Меры».
Шаг 3. Используйте выражение LOD в визуализации
- От Данные на панели 'Меры' перетащите Продажи на клиента к Рядов полку и поместите ее слева от СУММ (Продажи).
- На полке Строки щелкните правой кнопкой мыши Продажи на клиента и выберите Мера (сумма) > Средний. Теперь вы можете видеть как сумму всех продаж, так и средние продажи на одного покупателя для каждого региона. Например, вы можете видеть, что в Центральном регионе продажи составили примерно 500 000 долларов США со средней продажей для каждого покупателя примерно 800 долларов США .
Таблица LOD: Источники данных, поддерживающие выражения LOD
Источник данных | Поддерживается / не поддерживается |
Actian Vectorwise | Не поддерживается. |
Amazon EMR Hadoop Hive | Поддерживается Hive начиная с версии 0.13. |
Amazon Redshift | Поддерживается. |
База данных Aster | Поддерживается версия 4.5 и выше. |
Клодера Хадуп | Поддерживается Hive начиная с версии 0.13. |
Клодера Импала | Поддерживается Impala 1.2.2 и новее. |
Кубы (многомерные источники данных) | Не поддерживается. |
DataStax Enterprise | Не поддерживается. |
EXASOL | Поддерживается. |
Жар-птица | Поддерживается версия 2.0 и выше. |
Общий ODBC | Ограничено. Зависит от источника данных. |
Google Big Query | Поддерживается для Standard SQL, но не для Legacy. |
IBM DB2 | Поддерживается версия 8.1 и выше. |
MarkLogic | Поддерживается версия 7.0 и выше. |
SAP HANA | Поддерживается. |
SAP Sybase ASE | Поддерживается. |
SAP Sybase IQ | Поддерживается версия 15.1 и выше. |
Spark SQL | Поддерживается. |
Splunk | Не поддерживается. |
Таблица извлечения данных | Поддерживается. |
Терадата | Поддерживается. |
Vertica | Поддерживается версия 6.1 и выше. |
Microsoft Access | Не поддерживается. |
Подключения на основе Microsoft Jet | Не поддерживается. |
Hortonworks Hadoop Hive | Поддерживается Hive начиная с версии 0.13. В версии 1.1 HIVE выражения LOD, которые производят перекрестные соединения, ненадежны. |
IBM BigInsights | Поддерживается. |
Microsoft SQL Server | Поддерживается SQL Server 2005 и более поздних версий. |
MySQL | Поддерживается. |
IBM PDA (Netezza) | Поддерживается версия 7.0 и выше. |
Oracle | Поддерживается версия 9i и выше. |
Actian Matrix (ParAccel) | Поддерживается версия 3.1 и выше. |
Pivotal Greenplum | Поддерживается версия 3.1 и выше. |
PostgreSQL | Поддерживается версия 7.0 и выше. |
Прогресс OpenEdge | Поддерживается. |
Таблица LOD: Табличные вычисления против LOD
Выражения уровня детализации не являются новой формой табличных вычислений. Хотя они могут заменить многие табличные вычисления, их главная цель - открыть новые возможности.Выражения уровня детализации и вычисления таблиц работают по-разному.
Табличные расчеты | Выражения LOD |
Табличные вычисления производятся Результаты запроса . | Выражения уровня детализации генерируются как часть запроса к базовый источник данных . Они выражаются как вложенный выбор, то есть в зависимости от производительности СУБД. |
Табличные вычисления могут дают только результаты равные или менее детализированные чем указанный LOD. | LOD может дать результаты независимо от указанного LOD . |
Измерения, управляющие операциями с таблицей, отделены от синтаксиса вычислений. | Измерения, которые управляют операциями выражения LOD: встроено в выражение сам. |
Табличные вычисления используются как агрегированные показатели . | Выражения уровня детализации могут использоваться в других конструкциях. |
Фильтры в табличных вычислениях действуют как СКРЫВАТЬ . | Фильтры на уровне детализации действуют как ИСКЛЮЧИТЬ . |
Таблица LOD: Ограничения LOD
Ниже приведены ограничения, которые применяются к выражениям уровня детализации.
- Выражения уровня детализации, которые ссылаются на меры с плавающей запятой, имеют тенденцию вести себя ненадежным образом при использовании в представлении, которое требует сравнения значений в выражении.
- LOD не отображается на странице источника данных.
- При ссылке на параметр в объявлении размерности всегда используйте имя параметра, а не значение параметра.
- При смешивании данных связывающее поле из первичного источника данных должно быть в представлении, прежде чем вы сможете использовать выражение с уровнем детализации из вторичного источника данных.
Кроме того, некоторые источники данных имеют ограничения по сложности. Tableau не отключит вычисления для этих баз данных, но возможны ошибки запроса, если вычисления станут слишком сложными.