阅读(2565) (10)

TensorFlow对数据集重新取样

2017-09-21 14:56:02 更新

tf.contrib.data.rejection_resample

rejection_resample(
    dataset,
    class_func,
    target_dist,
    initial_dist=None,
    seed=None
)

定义在:tensorflow/contrib/data/python/ops/dataset_ops.py.

重新取样此数据集以实现目标类分布.

注意:重新取样是通过拒绝抽样进行的;输入值的一部分将被删除.

ARGS:

  • dataset:一个数据集对象.
  • class_func:一个函数,用于映射张量的嵌套结构(具有由 dataset.output_shapes 和 dataset.output_types 定义的形状和类型)到标量 tf.int32 的张量,值应在[0, num_classes].
  • target_dist:浮点型张量,形状为[num_classes].
  • initial_dist:(可选)浮点型张量,形状为[num_classes].如果没有提供,那么真实的类分布是以流式方式进行估计的.
  • seed:(可选)用于重新取样的 Python 整数种子.

返回:

返回一个数据集.