kettle 通过java实现正态分布密度函数调用

news/2024/7/21 5:28:30 标签: kettle, 正态密度函数, excel, normdist

kettle_0">kettle版本

kettle 5.4

需求描述

excel中可以通过正态分布函数NORMDIST生成给定值的正态分布值,如下所示:
在这里插入图片描述
本文讲解如何通过kettle实现excel的NORMDIST函数。

实现效果

在这里插入图片描述

实现方式

1、生成记录

模拟数据输入
在这里插入图片描述

2、Java代码

使用注意:
如果直接将计算的double值输出,kettle默认会截断为小数点后1位,所以这里输出为字符串,保留小数点后5位。
在这里插入图片描述
详细代码:

import org.apache.commons.math3.distribution.NormalDistribution;

public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException
{
	// Let's look up parameters only once for performance reason.
	//
	if (first) {
	  first=false;
	}

	// First, get a row from the default input hop
	//
	Object[] r = getRow();

	// If the row object is null, we are done processing.
	//
	if (r == null) {
	  setOutputDone();
	  return false;
	}

	// It is always safest to call createOutputRow() to ensure that your output row's Object[] is large
	// enough to handle any new fields you are creating in this step.
	//
	Object[] outputRow = createOutputRow(r, data.outputRowMeta.size());

	double x_in = get(Fields.In, "x_in").getNumber(r);
	double mean_in = get(Fields.In, "mean_in").getNumber(r);
	double standard_dev_in = get(Fields.In, "standard_dev_in").getNumber(r);

	// Set the value in the output field
	//
	Number nd = getNd(x_in, mean_in, standard_dev_in) ;
	logBasic("nd:"+nd);
//	get(Fields.Out, "nd").setValue(outputRow, nd);
	get(Fields.Out, "nd").setValue(outputRow, String.format("%.5f",nd));

	// putRow will send the row on to the default output hop.
	//
	putRow(data.outputRowMeta, outputRow);

	return true;
}

/**
 * 计算正态分布值
 * 
 * <pre>
 * 方法同excel NORMDIST 函数
 * </pre>
 * 
 * @param x
 *            需要计算其分布的数值
 * @param mean
 *            分布的算术平均值
 * @param standard_dev
 *            标准偏差
 * @return 正态分布值
 */
public static double getNd(double x, double mean, double standard_dev) {
	return new NormalDistribution(mean, standard_dev).density(x);
}

3、写日志

内容保留为空即可,默认输出全部变量
在这里插入图片描述


http://www.niftyadmin.cn/n/676552.html

相关文章

数据质量管理—1、数据概要(Data Profiling)

数据质量&#xff08;Data Quality&#xff09;是数据分析结论有效性和准确性的基础也是最重要的前提和保障。数据质量保证&#xff08;Data Quality Assurance&#xff09;是数据仓库架构中的重要环节&#xff0c;也是ETL的重要组成部分。 我们通常通过数据清洗&#xff08;D…

数据质量管理—2、数据审核(Data Auditing)

前一篇文章介绍了数据质量的一些基本概念&#xff0c;数据质量控制作为数据仓库的基础环节&#xff0c;是保障上层数据应用的基础。数据质量保证主要包括数据概要分析&#xff08;Data Profiling&#xff09;、数据审核&#xff08;Data Auditing&#xff09;和数据修正&#x…

鸿蒙内核切换,鸿蒙内核源码之线程环境下的任务切换

在鸿蒙的内核线程就是任务,系列篇中说的任务和线程当一个东西去理解.一般二种场景下需要切换任务上下文:在线程环境下&#xff0c;从当前线程切换到目标线程,这种方式也称为软切换,能由软件控制的自主式切换.哪些情况下会出现软切换呢?运行的线程申请某种资源(比如各种锁,读/写…

json在线解析将html标签转义,JSON在线解析及格式化验证

JSON在线解析及格式化验证 1706提示&#xff1a;您本机的IP地址是 59.63.117.185&#xff0c;查询IP地址 59.63.117.185 在哪里&#xff1f;JSON 在线解析格式化压缩去除转义验证JSON 转 XMLJSON 转 CSVJSON 转 YAML警告&#xff01;JSON 格式错误。JSONJSON(JavaScript Object…

数据质量管理—3、数据修正(Data Correcting)

前面的两篇文章——分析的前提—数据质量1和分析的前提—数据质量2分别介绍了通过Data Profiling的方法获取数据的统计信息&#xff0c;并使用Data Auditing来评估数据是否存在质量问题&#xff0c;数据的质量问题可以通过完整性、准确性和一致性三个方面进行审核。这篇文章介绍…

接口数据展示到html页面上,当我们从后端接口或者json文件使用ajax获取数据之后现实到页面...

Vue.js是一个构建数据驱动的web界面的库。重点集中在MVVM模式的ViewModel层&#xff0c;因此非常容易与其它库或已有项目整合Vue.js 的核心是一个响应的数据绑定系统&#xff0c;它让数据与DOM保持同步非常简单如下列表展示&#xff0c;当我们从后端接口或者json文件使用ajax获…

难以解释的数据异常-回归均值效应

在分析数据的时候&#xff0c;总有那些一些数据异常无法找到适当的理由进行合理解释&#xff0c;也许可以换个角度来看待这些异常。为什么明明数据发生较大的起伏波动&#xff0c;我们绞尽脑汁还是无法找到合理的原因&#xff0c;这些到底是怎么样的异常&#xff0c;是不是存在…

html5 实现按钮选择器,基于jQuery实现的文字按钮表单特效整理

1.jQuery幻灯片按钮控制图片过渡特效基于jQuery实现的幻灯片按钮控制图片过渡特效源码&#xff0c;共有4幅图片进行自动切换&#xff0c;且切换时有幻灯片过度的效果。用户还可自定义幻灯片的标题文字和内容。是一款非常优秀的特效源码。2.htm5CSS3实现的表单美化带输入验证特效…